
第1章、总论
1.1概述
电子政务的建设已经成为今后一个时期我国信息化工作的重点,先行带动国民经济和社会发展信息化,同时加快职能的转变,提高行政质量和效率,增强监管和服务能力,促进社会监督,实施信息化带动工业化的发展战略,当前的电子政务已经成为各部委的电子政务外部业务的承载平台,不再是单一部门的业务承载网,电子政务正逐步在演变为一个跨系统、跨部门的电子政务外部平台,2011年的电子政务建设也会转向电子政务外部平台建设。
电子政务云计算数据中心(以下简称“数据中心”)的建设是为了解决部门间信息共享,实现业务部门之间的数据交换与数据共享,促进XX市电子政务的发展。
1.2建设背景
国家信息化领导小组决定,把电子政务建设作为今后一个时期我国信息化工作的重点,先行,带动国民经济和社会发展信息化。《国家信息化领导小组关于我国电子政务建设的指导意见》中明确指出,电子政务建设对于加快职能转变,提高行政质量和效率,增强监管和服务能力,促进社会监督具有十分重要的意义,因此电子政务系统必将成为我国重要的信息化基础设施,成为贯彻党的方针、保障政令畅通、落实监管职能、提高服务水平的重要手段。
“十二五”期间,我市电子政务建设的主要目标是:建成标准统一、功能完善、安全可靠的政务信息平台,发挥支持作用;重点业务系统建设取得显著成效;基础性、战略性政务信息库建设取得重大进展,数据资源共享程度明显提高;初步形成电子政务网络与信息安全保障体系,建立规范的培训制度,与电子政务相关的法规和标准逐步完善。
1.3建设必要性和可行性
过去的数年中全国各地区都在构建电子政务,为此国家信息中心下发了有关电子政务建设的技术指导,电子政务发展至今,其地位已经发生了变化,当前的电子政务已经成为各部委的电子政务外部业务的承载平台,不是单一部门的业务承载网,电子政务正逐步在演变为一个跨系统、跨部门的电子政务外部平台,当前电子政务外部平台的建设,网络的互通已经不再是建设的目标,更加关注电子政务的业务应当如何承载,数据应该如何整合,如何能够构建统一、全面的安全管理业务数据?数据整合、灾难备份作为电子政务信息安全的最后一道防线,已经得到电子政务信息部门的高度重视,统一建设数据中心的模式无论从投资、管理、应急方面论证都是电子政务数据集中、数据整合的理想模式。
目前的情况,每一个机构已经开发了自己的信息系统而不是处于孤立的状态。每一个产品和服务需要的信息系统来提供。每个信息系统通常是单独打包。没有通用的架构能够让前台和后台、后台和组织外部的系统的应用连接起来进行通讯,识别和授权的功能能够在每个信息系统中找得到,但不会一个组织内部重新使用,更谈不上在组织之间重新使用。
数据中心主要是G2G、G2C、G2B等业务的集中处理中心,建设的重心与机构的业务紧密结合,是后电子政务时代数据大集中的体现,实现对集中数据的统一管理与备份。
1.4建设目标与任务
数据中心的建设是为了解决部门间信息共享,实现业务部门之间的数据交换与数据共享,促进XX市电子政务的发展。具体目标如下:建立数据中心的系统平台。完成相应的应用软件和数据管理系统建设,实现数据的交换、保存、更新、共享、备份、分发和存证等功能,并扩展容灾、备份、挖掘、分析等功能。
(一)建立数据中心的系统平台。完成相应的应用软件和数据管理系统建设,实现社会保障数据的交换、保存、更新、共享、备份、分发和存证等功能,并扩展容灾、备份、挖掘、分析等功能。
(二)建立全市自然人、法人、公共信息库等共享数据库,为宏观决策提供数据支持。对基础数据进行集中管理,保证基础数据的一致性、准确性和完整性,为各业务部门提供基础数据支持;
(三)建立数据交换共享和更新维护机制。实现各业务部门之间的数据交换与共享,以及基础数据的标准化、一致化,保证相关数据的及时更新和安全管理,方便业务部门开展工作;
(四)建立数据共享和交换技术标准和相关管理规范,实现各部门业务应用系统的规范建设和业务协同;
(五)为公共服务中心提供数据服务支持,实现面向社会公众的一站式服务;
(六)根据统计数据标准汇集各业务部门的原始个案或统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,为领导决策提供数据支持;
(七)为监督部门提供必要的数据通道,方便实现对业务部门以及业务对象的监管,逐步实现有效的业务监管支持;
(八)为业务数据库的备份提供存储和备份手段支持,提高业务应用系统的可靠性。
第2章、需求分析
2.1用户需求
从与数据中心交互的组织机构、人员方面进行说明。
| 与数据中心交互的单位机构 | |
| 各业务部门 | 通过接口系统向数据中心提供数据或使用数据中心提供的数据;业务部门之间可直接交换数据。 |
| 各业务系统单位 | 遵循标准规范进行业务系统建设和改造,实现业务系统与数据中心的对接。 |
| 与数据中心交互的人员 | |
| 数据中心系统管理员 | 负责数据中心系统管理、监控、系统维护 |
| 数据中心数据管理员 | 负责数据的整理、比对、数据一致性的保证,并且与区县级数据中心、省数据中心数据管理员协同工作,执行数据标准。 |
| 业务部门数据管理员 | 一般与同级数据中心数据管理员协同工作 |
XX市电子政务数据中心必须满足电子政务平台进行数据交换的需要,同时还必须满足在平台上建立的各业务系统进行综合业务处理的要求。为门户系统提供各种静态和动态的数据、信息。所谓静态信息是指对电子政务的运行中不经常变化,供各个业务系统查询、处理的数据或信息:、法规、元数据、资料库、各种多媒体数据等,它们会随着时间而逐步增大。所谓动态数据是指随着运行而增加、修改的数据:并联审批中文件流转状态数据,反映企业、个人所处状态的数据,国民经济运行状态的数据等。动态数据同各个局委办的信息密切相关,但又是面向主题的,如XX市社会保险这个主题,实际上同保险、工资、税务和银行密切相关;个人信用使用主题,它的数据与银行、税务、个人消费、个人收入密切相关。而数据仓库显然也有面向主题的定义,但这些主题是较长时间的,具有战略定义的主题。因此,数据中心的建设,首先要解决数据库异构信息类型的分类存储和检索体系以及针对不同类型数据模型的设计这一基本问题。
另一方面,数据中心管理着大量的结构化和非结构化信息。所谓非结构化信息,是相对于那些有清晰的结构和类型定义以及有数据相关性的明确描述的信息类型而言的。比如,在财税分析系统中,财政收支情况的月度数据,可以理解为一种有清晰结构的信息;而一份综合性包含了文字、报表、分析图形的财政收支分析报告则是一种非结构化的信息。网站上发布的信息,如新闻动态、政务公开等等,一般也是非结构化的信息。
此外,非结构化信息中还包括了一类对象数据信息。所谓对象数据信息,是指一个包含了内敛结构的专门数据块,这个数据块单独无法建立与别的数据项的关联关系,并且需要工作在特定的工作模块下。比如:GIS空间定义信息数据、多媒体的声像数据等,均为对象类型的数据。
在决策应用中,非结构化信息将占到相当的比例。所有的文件均属于非结构化信息,法规属于非结构化信息,一些决策分析的综合性资料也是非结构化信息。
与结构化信息相比,非结构化信息的管理利用存在一些难点,就是:
(1)定义管理的难度
“非结构”化表明了没有一种象关系数据库规范那样的定义模型来对非结构化信息进行定义管理。虽然你可以强制对一个非结构化的信息块进行解构,将其分成类似头、中、尾这样的半结构。但是这种解构只有在制定了具有普遍含义的结构描述定义后才有真正的意义。
对非结构化信息进行定义管理的另一个难点在于数据元类型无法穷举。不象关系型数据系统中,对数据元类型有完整清晰的定义。在非结构化信息中,包含了错综复杂的数据元类型。比如,仅文档类型就包括Text、Word、PDF、Excel、Word Pro等等,还有各种图片文件格式、多媒体压缩信息格式等等。此外,在象网页这样的非结构化信息中,所有的信息都是文字类型,设定时间、数字等类型的信息元并不具有运算上的意义。
(2)存储管理的难度
对信息进行存储管理的前提是能够建立有效的数据定义,然后才能进行非结构化信息的组织存放。而前面已经提到了在非结构化信息的数据定义方面存在的难度,因此也就造成了在非结构化信息存储管理方面的困难。
当然,对非结构化信息最简单的存储方式是直接存放在文件系统中。这样做避免了依据主题等分类因素对非结构化信息进行管理的问题,但也是最最低效的一种存储管理方式。
在非结构化信息的存储管理中还涉及到一个问题,由于这些信息元(如果对非结构化信息进行一定的半结构化处理后)的数据可能来自关系型数据系统(比如Oracle)、对象数据系统(多媒体数据或空间数据)乃至文档数据系统(比如Notes),所以一个非结构化信息的存储管理系统将充当一个数据的汇整者,需要具备联合各个外部数据系统的功能。缺乏对非结构化信息的有效管理造成的直接结果就是无法对非结构化信息进行有效检索。
(3)信息检索的难度
由于不能像关系数据库那样建立起清晰定义的数据主题,非结构化信息的检索依照的只能是机械的全文内容检索。
这是对信息检索非常不利的一点。虽然对信息内容的全文检索可以做到资料检索的遍历,但其检索的效率和命中率是很低的。由于不象关系数据库那样有一种象SQL(结构化查询语言)那样强大的关联检索工具,并且在定义数据时也没有建立数据项之间的关联关系,要具有针对性地查询非结构化信息的内容,必须要依靠应用程序中设置对特定非结构化信息类型进行专门处理的功能内容,才可能提高信息检索的强度和效率。但另一方面讲,一种专用于理解特定非结构化信息类型的处理模块,无论在运行效率还是在可维护性上,都是非常不现实的。非结构化信息检索的另一个难度也是与数据元类型的多样性有关的。比如,不同的文档类型结构需要不同的全文索引工作模块。这也无形中加大了对非结构化信息进行检索的难度。
因此,数据中心的建设,还必须从技术体系上解决如何对非结构化信息进行有效定义、有效管理和有效利用的基本问题。
2.3系统及应用需求分析
数据中心的主要业务包括:
从基层或业务部门采集数据,包括基础数据和部分共享业务数据,支持基础和共享数据的更新维护模式;
对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范进行处理,保证数据的一致性和准确性;
受理业务部门或基层单位的基础数据使用申请;
将整理后的基础数据分发或按需提供给有关部门或单位使用;
以中介的方式处理共享业务数据使用申请,并进行备案;
对共享业务数据在征得业务部门同意的情况,通过数据中心进行存储转发;
将共享元数据的信息发布给各业务部门,提供浏览与订阅申请,方便其共享必要信息;
提供数据交换平台和接口系统,使数据中心与各部门的数据管理员可以对共享和交换过程进行管理;
通过数据交换平台存储和管理公共服务数据,并与同步,提供一站式服务;
存储和管理统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,对数据进行统计和分析,方便领导及时掌握有关情况。
定期对业务数据库进行容灾备份;
与此相对应,业务部门与数据中心发生的相关业务包括:
提供数据或共享元数据给数据中心;
申请使用数据中心的基础数据,校准本单位的基础数据;
通过数据中心提供的共享元数据信息获取其他单位的数据;
审批其他单位的业务数据使用申请,并将数据提供出去;
与数据中心交换公共服务数据;
提供监督部门直接访问业务数据库的通道;
提供统计分析数据或原始个案给数据中心,方便主管领导查询;
定期将业务数据库备份到数据中心;
根据数据中心与各业务部门的主要业务,数据中心应提供如下功能:
2.3.1节点管理
实现与数据中心相连的各个节点的信息管理、配置管理,包括业务部门、区县数据中心等。
2.3.2主题管理
数据采集、数据发布、数据共享、数据交换、公共服务以及决策支持均以主题的方式进行,因此必须实现对主题的管理。主题是元数据的集合。
2.3.3元数据管理
元数据是关于数据的数据。元数据描述了数据的结构和意义,同时也可以描述应用程序和流程的结构和意义。构造数据中心数据库的重要步骤之一,就是定义和创建元数据(Metadata)。元数据提供一个目录,列出数据中心有什么数据。所有进入数据中心的数据,必须在元数据中有所表述。数据中心的数据管理系统必须提供储存和管理元数据的方法。以元数据管理为核心,建立数据中心的数据资源目录体系,提供给业务部门参考使用。
数据中心的元数据包括基础数据元和共享数据元,由数据中心统一管理。基础数据元由数据中心定义,共享数据元由业务部门定义并注册到数据中心。业务部门进入数据中心的元数据管理中心好比进了一个“超市”,可以方便地知道可以获取和使用哪些数据,并进行数据使用申请的定制。
2.3.4公共代码管理
对公共代码需要有统一的标准规范,数据中心必须提供公共代码的管理。基于数据中心的公共代码规范,各部门和区县数据中心可以通过数据转换将各种不同含义的编码和标准规范的编码之间进行双向的转换。
2.3.5数据采集
与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总数据,对原始数据进行缓存、存储。
2.3.6数据整理比对
从各业务部门采集共享数据后,进行数据转换,对全市自然人和法人基本数据进行数据比对、冲突检测处理并入库。
2.3.7数据交换
实现业务部门与数据中心之间以及业务部门之间的数据交换业务,形成高效、安全、可靠、稳定的数据交换网络。提供定时批量、实时按需的数据交换,提供点对点、一对多的数据交换支持,对数据交换进行管理和监控。
2.3.8数据访问
在统一的权限管理系统之上,实现对自然人和法人的建档、调档、阅档等业务。对社保卡系统、公共服务中心系统、业务系统提供数据访问。对决策支持系统、业务监管提供数据支持。
2.3.9数据备份与恢复
恢复管理是对数据进行备份、导入导出以及数据库恢复等。数据是数据中心核心的资源。全面的容灾方式应该是数据备份+数据复制+远程容灾。对系统中的数据要定期进行系统备份。采用本地备份与异地备份相结合的方式。
2.3.10标准管理
进行数据中心的标准规范尤其是数据标准的审核制定、升级维护与发布实施等管理功能。在数据中心的建立之初,由于标准规范处于不断完善的过程,应建立标准的版本管理机制,方便业务部门的查询和使用。
2.3.11应用支持
对相关业务应用系统、公共服务系统、业务监管系统和决策支持系统提供提供数据、通道和平台等支持。
2.3.12运行管理
为方便对数据中心的管理和维护,需要一套功能完整的运行管理与监控维护系统。运行管理系统主要提供给数据中心的系统管理人员使用,用于保证数据中心的安全可靠和高效运行。其功能主要包括面向安全性的用户管理、权限管理、密码管理和日志管理等;面向性能优化的性能监控等。面向可用性的节点管理、交换规则管理和状态监控;其中节点管理包括对业务部门的信息管理。
2.4性能需求分析
2.4.1业务处理量分析
数据中心的主要业务包括:
(1)基础数据的采集、转换、比对以及分发
这是数据中心的主要负载压力所在。
(2)业务数据交换的备案或存储转发
在数据中心建设初期,业务数据在业务部门之间交换;当业务部门的接口系统难以承受数据交换的负载时,才可能通过数据中心存储转发。所以这部分业务不会对负载造成负载压力。
(3)元数据库和公共代码库的管理和共享
由于元数据库和公共代码库相对稳定,并且数据量不是很大,所以不会对数据中心造成负载压力。
(4)与业务部门交换公共服务数据
由于业务不停地在发生,即使采用定时批量的交换方式,也会对数据中心造成较大的负载压力。
(5)汇集统计数据,并提供查询
统计数据一般按月提供,而且提交的一般为结果数据,在数据交换方面不会构成太大压力。领导的数据查询会形成少量的负载。
(6)提供业务部门的容灾备份
容灾备份不需通过数据库服务器处理,所以不会对数据中心的负载构成压力。
数据中心的主要负载压力在于两个方面,一是基础数据的采集、维护和使用;二是数据中心与业务部门之间的公共服务数据交换。下面我们分别进行分析。
基础数据的变动将引起数据中心的负载。首先业务部门需将变动数据交换给数据中心,数据中心采集后进行转换和比对,然后进行发布,分发给有需要的部门使用。
数据中心提供对公共服务系统的支持。各业务部门的公共服务业务数据通过统一的数据共享与交换平台即时或定时的交换到数据中心,保存到公共服务数据库。再与的公共服务数据库同步。
估计数据中心采集一次数据变动相当于2笔数据库交易;进行转换和比对相当于3笔数据库交易,然后再将基础数据分发给10个左右的业务单位共享使用,每分发一次相当于1笔数据库交易。根据我们以上对数据中心的变动次数的估计,每年的业务量约为:(500+100)*(2+3+1*10)=9000万笔数据库交易。
按一年250个工作日,每个工作日8小时计算,每分钟的业务量约为:9000万笔 / (250*8*60)= 750笔/分钟
依据“80-20”估算方法,峰值的业务处理量为:3000笔/分钟。
2.5安全及保障机制需求分析
2.5.1系统安全可靠性需求
数据中心如果遇到破坏,或无法正常工作,将造成无法估量的损失。需要保护的资源不仅有物理资源(设备、设施)、数据资源(数据、数据库软件等),而且还有网络资源(通信链路、网络接入等)。
2.5.2数据安全保密性需求
满足在数据存储、传输过程中的安全保密性需求。社会保障工作中涉及大量的敏感数据,在其处理过程中,特别是与各级单位数据交换过程中,要进行数据加密传输和存储,要保证数据的安全保密性。
2.5.3数据完整性需求
满足在数据存储、传输过程中的完整性需求。在内部要保证数据存储和传输过程中不被篡改和破坏;在与各级单位数据传输的过程中,要保证数据不被篡改和破坏。
2.5.4实体的可鉴别性需求
满足数据中心系统对用户及数据交换服务器的可鉴别性需求。系统要实现监管及其他方面的需求,其必要条件是实现实体的可鉴别性,包括用户及数据交换服务器具有可鉴别性等。
2.5.5不可否认性需求
满足数据中心用户行为和系统行为不可抵赖性的需求。用户每天都利用数据中心处理大量的事务,事务处理过程的可管理、效率的可审计、行为的可审计等,需要行为的不可抵赖性来解决,本项目建设中要保证在所有数据处理过程中,办公人员行为和系统行为的不可抵赖,以便审计和监督。
2.5.6对象和行为的可授权性需求
实现对数据资源的自主授权和访问控制的功能。针对数据交换共享工作的特点,要求数据中心具有对对象灵活授权的功能,包括用户对用户的授权、系统对用户的授权、系统对系统的授权等,以及授权过程的审计监督。
2.5.7统一信任与授权策略需求
对于涉及十多个业务部门、若干业务系统的数据中心而言,安全性的实现不仅体现在各个部门、各个业务系统中,更重要的是在不同业务部门的不同系统实现互联后,如何保障数据、业务系统在互通后的信任、授权的一致性,因此在大社保系统中,必须建立统一的信任策略、授权策略,实现跨部门、跨系统的信任和授权服务的一致性,杜绝由于不同部门、不同业务系统不同的安全策略、不同的安全等级带来的安全漏洞和安全隐患。
2.5.8数据中心统一安全监管性需求
由于数据中心涉及多个部门,因此需要实现数据交换、共享过程的可管理,实现对内部和对各级单位相关的业务处理的可审计性;系统中有大量的数据交换服务器、维护终端、系统软件、网络设备等,为使这些资源协同工作,需要实现对实体(用户或数据交换服务器)进行统一的管理;系统需要对用户行为和系统行为进行记录和统计,对系统日志进行分析和统计,提供对用户和系统行为的审计监督。这种统一的安全监管必须以可靠的技术和严格的管理来保证。
2.5.9保障机制需求分析
(一)制定《XX市政务数据资源目录管理办法》,重点说明政务数据资源目录体系和运行模式,明确提供方、使用方和管理方的职责分工。提供方负责政务数据资源目录中本部门政务数据资源的编目、注册、维护等;管理方负责政务数据资源目录的审核、发布和管理,并负责政务数据资源目录管理服务系统的日常运行维护;使用方负责对获取的政务数据资源在授权范围内合法使用。
(二)制定《XX市数据中心实施指南》,重点说明指导管理人员如何通过政务数据资源目录管理服务系统开展日常业务和管理服务工作,以及指导政务部门通过数据中心系统建立和更新维护数据资源目录等。
(三)要结合本市特点和实际情况制订相关机制。
第3章、数据中心设计方案
3.1设计原则
3.1.1统一建设
数据中心必须统一规范建设。通过制定统一的数据交换与共享标准,建设统一的数据共享与交换平台和统一的接口系统,可以避免重复投资,降低接口的复杂性,有效实现数据中心与业务部门以及业务部门之间的数据共享与数据交换,消除“信息孤岛”,实现数据资源的互联互通。
3.1.2相对
根据数据中心的功能定位,数据中心的建设和运作必须保持业务系统的相对性。为此采用松散耦合方式,通过在业务部门统一配置接口系统实现数据资源整合。
3.1.3共建共享
一方面建设数据中心的目的是为了实现业务部门之间的数据共享。
另一方面,数据中心的数据来源于各个业务部门,因此数据中心的建设必须依靠各业务部门的积极参与和配合。
3.1.4安全可靠
数据中心的安全是非常重要必须要做好系统的安全设计,防范各种安全风险,确保数据中心能够安全可靠的运行。同时数据中心必须采用成熟的技术和体系结构,采用高质量的产品,并且要具有一定的冗灾功能。
3.2数据中心平台设计
3.2.1平台总体架构
3.2.2数据资源规划
数据资源是数据中心最重要的资源。数据中心的数据资源分布状态具有阶段性,每个阶段都对应数据资源整合的不同阶段,体现数据资源的管理集中、有机分布的特点。根据“基于数据,围绕数据,面向数据”的建设思路,我们进行数据资源体系的总体规划,然后具体描述共享型的共享数据库、操作型的业务数据库和分析型的历史数据库这三类数据资源的构建、维护和使用。
3.2.2.1数据资源规划的总体思路
数据资源规划的总体思路主要包括如下几个方面:
数据共享标准化
首先共享数据是标准的,其次共享的方法和途径是规范的。目前各系统数据资源数据库已经有多种存在方式,要解决系统间信息的互连、互通、互操作,必须针对共享数据建立共同遵守的标准规范,只有编码是统一的、格式是统一的、数据交换的方式是统一的,才能保证数据是一致的,才能实现对数据交换和数据共享的有效管理。
业务数据相对
各职能部门分管业务的范围和职责不同。因此,系统在全局考虑、统一设计的同时,还要充分考虑不同业务部门自身的特点,在统一规划的前提下,保证支持不同业务活动的数据具有相对性,建立面向各部门进行联机事务处理的业务数据库。
决策数据集成化
建设数据中心的另一个目的就是将各部门的业务结果数据有机地集成在一起,进行综合查询和统计分析,为各级领导的决策提供有力的数据支持。
3.2.2.2数据资源体系结构
数据中心数据资源体系结构
对公共服务系统、业务应用、决策分析提供支持,数据中心的数据库包含如下内容:
共享数据库,包含:自然人基础数据、法人基础数据库、元数据库、标准代码库、共享业务数据(如果业务部门之间通过数据中心进行数据交换)。
统计分析数据库,汇集各业务部门的统计分析数据,为决策提供数据支持。
运行管理数据库,用于监控管理、节点管理、日志等。
公共服务数据库,提供对公共服务系统的数据支持。
3.2.2.3共享数据一致性的保证
共享数据包括自然人和法人基础数据及其元数据和标准代码数据、共享业务数据。共享数据一致性问题是数据中心面临的关键问题。从范围上划分,共享数据包括基础数据,基础数据包含基准数据。
●基准数据
基准数据是指唯一表示自然人和法人的数据字段集合,自然人有身份证号码和姓名标识,法人有法人机构代码和名称标识。基准数据主要来源是市和市质监局。基准数据必须保证在整个社会保障信息系统是一致的,将来扩展到整个电子政务系统是一致的。市和市质监局负责将更新的信息交换到数据中心;市数据中心负责汇总数据,进行比对整理校验,形成一致的基准数据,通过数据共享与交换平台分发给市级各业务部门和区数据中心;由业务部门/区数据中心校验更新自身的基准数据,保证基准数据的一致性。基础更新频度要达到每天更新甚至实时更新。数据的传递和分发通过数据交换平台实现。
●基础数据
基础数据是指自然人和法人的常用基本信息,各业务部门日常管理都需要用到的面向主题的数据。基础数据包括自然人和法人的基准数据和其他元数据。主要来源是市级业务部门和区数据中心。基础数据一致性必须建立于基准数据一致性的基础上。基础数据的一致性也需要通过数据共享与交换平台和相应的机制、管理办法来保证。各部门按照业务职能明确元数据维护责任和权限,定期将在办理业务过程中更新的元数据项数据提供给数据中心;数据中心根据基准数据一致性的原则,对各业务部门提供的数据进行比对校验,正确的数据增加或更新到数据库中,并每天按照各业务部门业务要求,将更新数据分发到各业务信息系统;各业务部门可以直接使用这部分数据作为支撑行政业务和行政管理的数据资源,也可以作为业务参考信息。基础数据的范围将随着元数据范围的扩大而扩大。这部分数据同时可作为社保卡的数据。基础数据更新的频度,按照元数据使用的频度分别定义,通过部门协商机制研究确定,最低要求每周更新,一般每天更新,业务关联度较高的信息,要实现实时更新。数据的传递和分发通过数据交换平台实现。
●元数据标准和标准代码数据
元数据标准和标准代码数据由市数据中心维护更新,并发布给各业务部门和区数据中心使用,由于业务部门系统内部沿用的代码可能与数据中心的发布版本不一致,业务部门需保证与其他业务部门进行共享交换的数据必须遵循数据中心的标准规范,而在系统内部可以采取逐步过渡迁移的方案,尽量减少影响业务运作。
●共享业务数据
共享业务数据是指多个业务部门之间需要共享使用的数据,作为各业务部门进行行政管理的参考数据。数据来源渠道包括市级业务部门、区级数据中心、社会保障卡和公共服务等业务运营机构。共享业务数据以业务数据的发生地管理部门为准。这类数据由各业务部门按业务需求和协商的频度提供给数据中心,在数据中心处提供各部门查询。由于这类数据量比较大,预计可以分业务、分批更新。
3.2.2.4共享数据库的建立过程
共享数据库的建立采取逐步扩展的策略,达到数据整体上的一致性、完整性和准确性是一个逐步完善的渐进式递归过程。共享数据库的建立由业务驱动,业务部门提供的自然人、法人基础数据经数据源单位确认后存入基准数据库,并反馈业务部门,经过不断的提交和确认,基准数据库的数据不断增加,覆盖范围不断扩大,比对的工作量逐步减少。在基准数据库的基础上,不断补充其他的自然人、法人基础信息,最终形成自然人、法人共享数据库。
采取围绕自然人和法人基准数据为核心,在核心的基础上不断扩充和完善自然人和法人共享数据的策略进行建设。首先建立和整理自然人和法人基准数据库,保证核心的准确性,为各业务部门进行数据清洗和整理提供基础;再在基准库的基础上搭建自然人和法人共享数据库的整体框架,共享的信息内容成熟一个、整合一个、交换一个。
3.2.3数据支撑平台
XX市电子政务数据中心支撑平台主要包括:数据共享交换子系统、目录管理服务子系统、共享数据管理子系统、共享业务管理子系统、系统配置管理子系统和系统安全管理子系统。
3.2.3.1数据共享交换子系统
数据共享交换子系统为全市各业务部门提供数据交换服务。
主要功能包括:
(1)交换管理
提供交换节点、交换服务和交换桥接的配置、调度和检测功能;提供交换服务和交换桥接的日志查询和统计功能。
(2)交换服务
提供共享域内交换节点之间的数据共享交换服务,包括采集、分发、汇总和转发;提供交换节点与业务系统之间的交换桥接服务,实现数据提供和获取;提供跨域交换服务,实现共享域之间通过对接节点进行数据交换。
数据交换引擎是数据共享交换平台的核心。数据交换引擎主要包括服务处理和数据接口。
(一)服务处理
数据交换引擎运行过程示意图如下:
图表 6数据交换引擎运行示意图
数据交换引擎接负责收并处理数据交换服务请求,实现数据的交换。主要包括:
(1)服务请求
服务请求采用监听机制,实现对服务请求的并发接收。
(2)服务解释处理器
服务解释处理器负责解释执行服务请求。服务请求把服务请求转发到解释处理器,服务解释处理器查询所请求的服务定义,根据服务定义产生执行序列并控制各个交换节点实现交换服务。在数据交换压力大的时候,根据服务的优先级高低,控制交换服务的执行顺序,确保高优先级的服务优先执行。
(3)服务定义
服务定义记录了服务的项选参数以及设置,描述了服务应该如何解释和执行。交换服务可以定义服务优先级等信息。
(4)接口控制
接口控制负责把命令序列发送到各个交换节点,控制交换节点上的数据接口,驱动数据交换的执行。
(5)传输管道
数据的交换过程是在传输管道中进行的,传输过程分为三部分,数据输出,网络传输、数据输入。在源节点的数据输出接口把数据由数据源读出,并根据服务配置经过数据加密、数据压缩等过滤器。经数据输出接口输出的数据通过消息中间件传输到目标节点。目标接点的数据接口接收到数据后反向经过各种过滤器把数据还原出来,然后写入到目标数据源。
(6)管道管理
管道管理器负责管理数据交换过程中的传输管理,包括管理的创建、动态分配、撤消等操作。
(7)日志监控
日志监控按级别记录数据交换引擎在运行过程中的事件记录,提供监控功能。
(二)数据接口
数据共享交换平台支持三种数据接口方式:交换库方式、文件方式以及Web服务方式,业务系统通过交换平台进行数据共享交换时,可以根据实际的情况选择合适的数据接口方式接入交换平台。
在接入节点时,根据实际情况选用一种或多种接口类型。对于有业务系统存在,只要求提供或获取共享业务数据的情况,建议采用数据库类型接口;对于需要获取基础数据的情况,以及实时性要求高的情况,建议使用Web 服务类型接口;文件类型接口根据实际情况决定是否采用。
3.2.3.2目录管理服务子系统
目录管理服务子系统是支撑平台的核心子系统,提供政务数据资源目录的注册管理以及政务数据资源的发现定位服务。
主要功能包括:
(1)目录管理
提供数据主题的管理功能,数据主题包含了对数据资源的语义信息和规格信息等;提供对目录层次结构的管理,包括系统自动管理以及手工管理两种方式。
(2)目录服务
按部门、专项以及分类标签等方式浏览数据资源目录;提供数据资源的检索和统计功能。
3.2.3.3共享数据管理子系统
共享数据管理子系统是支撑平台的一个基础子系统,是实现数据资源共享交换的基础。
主要功能包括:
(1)数据标准管理
提供公共数据元、信息分类和代码的配置管理功能。
(2)数据源管理
提供数据源的配置管理功能。
(3)数据质量管理
提供对共享数据的质量管理功能,包括问题数据的查询、浏览和统计。
3.2.3.4共享业务管理子系统
共享业务管理子系统是支撑信息共享申请、授权业务开展的系统。
主要功能包括:
(1)共享业务流程
提供对共享业务流程的支撑功能,包括共享业务申请和审核。
(2)共享业务统计
提供按部门、业务状态和业务时间等维度对共享业务统计功能。
3.2.3.5系统配置管理子系统
系统配置管理子系统是支撑平台的一个基础子系统。
主要功能包括:
(1)共享域
提供政务数据资源共享域的信息配置功能。
(2)全局配置
提供组织机构、系统信息等全局配置功能。
3.2.3.6系统安全管理子系统
系统安全管理子系统是支撑平台的一个基础子系统。
主要功能包括:
(1)用户管理
提供用户、用户组、角色管理功能。
(2)权限管理
提供基于角色(RBAC)的权限管理功能。
(3)操作日志
提供用户操作日志的查询和导出功能。
3.2.4数据共享交换平台
3.2.4.1交换网络结构
一般数据交换有两种常见的交换结构:星型交换和网状交换。在星型交换结构中,所有端节点都只与中心节点相关,通过中心实现数据交换;而网状交换结构中,数据可以在任意两个节点之间直接交换。
经过调研和分析,XX市各部门之间存在着复杂的数据共享和交换需求,并存在以下特点:
(一)同一批共享数据通常需要共享给多个子系统;
(二)对同一批数据,不同的子系统应用的需求存在差异;
(三)各个子系自开发,技术平台不一,数据标准不一;
(四)数据共享和交换要求进行备案。
因此,XX市电子政务数据中心采用星型交换结构,如下图所示:
图表 2 星型数据交换结构
采用星型交换结构有以下的优点:
(一)避免重复提供数据
如果同一批数据,有多个子系统需要共享,在星型交换结构中,数据提供方只需要提供一次数据。根据以上的分析,这种情况在本期项目是普遍存在的,星型交换结构有助于减少接入单位在开发、调试、实施、维护等各个阶段的工作量。
(二)中心统一控制简化管理
在网状交换结构中,交换服务分布在每一个节点,因此在进行服务管理时需要对每一个节点进行管理。这样数据共享交换平台的服务管理系统可能会设计成一个分布式的管理系统,或者是让管理员分别登录到不同的节点进行管理。无论采用何种实现方式,管理员都必须面对在N个不同节点上管理服务的问题。而在星型交换结构中,所有的交换服务都是集中在中心端,管理员只需要管理中心节点上的服务。
(三)降低实施过程对网络连接的要求
提供稳定可靠的数据交换服务,是数据共享交换平台的关键任务,采用星型交换结构,只需要保证各个端节点与中心节点之间的网络正常联通,而采用点对点网状交换结构则需要保证每两个点之间都联通。在实施过程中,不一定能保证每两个交换节点之间网络联通。因此采用星型交换结构在一定程度上降低数据共享交换平台的实施要求。
3.2.4.2交换概念模型
交换概念模型由中心交换结点和端交换结点组成。端交换结点接收和发送政务部门的交换信息。中心交换结点管理交换网络内端交换结点的数据交换服务,并根据需求形成共享信息库。
交换的概念模型如下图所示:
图表 3 数据交换概念模型
交换概念模型说明如下:
(一)业务信息是由各政务部门产生和管理的政务数据资源;
(二)交换信息是端交换结点用于存付参与交换的政务数据资源;
(三)共享信息库是可以为多个端交换结点提供一致的政务数据资源的信息集中存储区。任意一个端交换结点是可以按照一定的规则访问共享信息库。
(四)端交换结点是政务数据资源交换的起点或终点,完成业务信息与交换信息之间的转换操作,并通过交换服务实现政务数据资源的传送和处理;
(五)中心结点主要为交换信息提供点至点、点到多点的信息路由、信息可靠传送等功能。在两个端交换结点之间可以有0个或若干个中心交换结点;
(六)交换服务是交换结点传送和处理政务数据资源的操作集合,通过不同交换服务的组合支持不同的服务模式。交换服务按照数据交换任务的重要性以及时效性要求设置为不同的优先级。一般情况下,交换服务按照预先设定的调度计划执行。在服务器、网络资源紧缺的情况下,高优先级的交换服务可以优先执行,确保满足数据交换的时间要求。
3.2.4.3交换体系结构
XX市数据共享交换平台由中心交换节点和端交换节点组成,依托统一的电子政务,通过采用一致的交换协议,实现跨地区、跨部门应用系统之间的数据交换。
XX市电子政务数据中心作为中心交换节点,各政务部门的前置机作为端交换节点。政务部门业务系统通过交换桥接实现与前置机互联,接入数据共享交换平台。
XX市电子政务数据中心的交换体系架构如下:
图表 4 交换体系架构
业务库是由各政务部门产生和管理的政务数据资源库。交换库是政务部门提供本部门交换数据、获取其他部门交换数据的存储库。交换文件作用与交换库相同,把政务部门提供本部门交换数据、获取其他部门交换数据以文件形式存放在前置机上。
中心交换节点提供交换数据的采集、分发服务,实现交换节点之间的数据路由和传送功能。端交换节点提供交换数据的存储库、数据写入和读取接口以及文件上传和下载接口,业务系统与端交换节点之间通过交换桥接进行交换数据的提供和获取,并实现业务数据和交换数据之间的转换。
端交换节点是交换平台中数据交换的起点或终点。数据交换过程可分为数据提供、数据采集、数据分发和数据获取四个阶段:
(一)数据提供:数据从提供方的业务系统转换并传输到提供方的前置机;
(二)数据采集:数据从提供方的前置机传输到中心节点;
(三)数据分发:数据从中心节点传输到使用方的前置机;
(四)数据获取:数据从使用方的前置机传输并转换到使用方的业务系统。
其中,数据提供和数据获取流程由政务部门的交换桥接负责。数据采集和数据分发流程由中心数据共享交换平台负责。
业务系统可以通过公开Web服务的方式向数据中心或其他政务部门提供数据。政务部门获取数据时,也可以直接从数据提供方公开的Web服务获取数据。数据中心公开的Web服务主要用于共享基础数据,业务系统可以调用数据中心的数据共享服务查询基础数据。
3.2.5共享数据管理系统
在没有数据标准的时候,数据中心对同一个数据字段可以从多个数据来源采集数据。如:婚姻状态字段可以从计生部门和民政部门采集。对于同一个数据字段,数据中心对于该数据字段保存多个来源的版本。公共数据维护系统提供工具、服务来展现数据的不一致性,数据管理员根据工作制度,对数据字段进行电话等多种手段核实字段的真实数值,如果在一定的时限内不能解决冲突,则可以发布该数据字段的多个版本,每个版本都标明数据字段的来源,并指示该数据是存在冲突的。
通过数据共享与交换平台以数据服务的方式从各业务部门采集数据,保存到公共数据缓存库,使用公共数据维护系统进行数据比对、冲突检查、数据审核、数据转换。当数据达到一致性、完整性要求时,数据被发布到公共数据发布库,通过数据共享与交换平台以数据服务的形式提供数据使用方访问。
数据管理系统面向数据中心和业务部门的数据管理员,确保数据的一致性、准确性和完整性,为数据质量把关。
3.2.5.1功能设计
数据管理工作流
实现对数据管理的主要工作流程的管理,方便业务部门提供、使用和交换数据。比如从数据使用方提出申请,然后数据提供方进行审核,然后双方协商数据交换规则到最后配置实现的整个工作过程的管理。
数据转换
建立业务部门数据于标准规范数据的转换映射关系和转换规则,将业务部门的数据转换为符合标准规范的数据。
数据整理
对缓存数据库中的各业务部门数据进行比对、清洗,检查数据冲突,对数据进行审核校验。确保数据一致性、完整性。
数据发布
数据管理系统把经过比对、审核、转换之后的具有完整性、一致性的数据保存到数据中心的发布数据库,经过数据共享与交换平台发布提供各业务部门使用。
主题管理
数据中心以主题为单位实现数据采集、数据交换、数据共享、数据比对以及数据发布。因此必须提供主题管理功能。
元数据管理
对共享数据进行元数据管理,以主题的方式组织数据资源。
数据标准管理
对数据标准的内容、数据标准的版本进行管理,将标准变更对业务系统的影响屏蔽在数据接口系统一级。
数据维护
通过数据管理系统进行日常的数据维护工作,如:数据备份恢复。提供对业务系统的异地容灾数据备份的管理支持。
3.2.5.2逻辑结构
数据管理系统以主题的方式组织数据资源,提供元数据管理、数据供需关系管理、数据标准规范管理,与数据共享与交换平台结合,提供数据转换、整理、发布等功能。
数据管理系统逻辑结构示意图
3.2.6数据接口系统
数据中心的共享交换网络由数据中心的数据共享交换系统和部署在各市级业务部门、区数据中心的数据接口系统构成。
数据接口系统由3部分组成:数据共享和交换系统、缓存数据库、数据管理系统。数据接口系统提供业务部门和数据中心、业务部门之间的接口功能,在统一的数据共享与交换平台下进行安全、可靠、有效的数据共享与交换,并提供元数据管理、主题管理、数据供需关系管理、数据标准版本管理、数据安全管理。
数据接口系统不直接影响业务系统的日常运作。数据共享和交换的细节、安全性和权限控制都在数据接口系统中封装,并在统一的规范下,由业务部门进行管理。数据接口系统与业务系统是松耦合的关系。
\
图表 319 数据接口系统逻辑结构
3.2.7服务器系统设计
3.2.7.1设计原则
在服务器系统设计中,我们遵循以下的原则:
实用性
无论对于何种计算机系统,实用性永远是需要放在首位和着重考虑的。一个系统的建设是一项工程的实施,它的最基本的目标是建立一个适用实际环境的、能满足用户功能需求的实用系统,而不是一味追求技术的领先和产品的更新。
广泛采用标准
随着计算机技术的发展,芯片技术、存储系统、各种传输协议以及与外部系统的接口等都已逐渐形成标准。采用标准化的设计,能使系统具有良好的可扩充性及兼容性,能与其他厂商产品配套使用,给各种系统软件和应用软件的安装运行带来方便,同时有利于系统的升级和与其他系统的数据交换。
先进性与适用性的统一
计算机技术的发展与时间不是简单的线性关系,从投资保护及长远考虑的角度来看,在系统设计时保持一段时间的先进性也是十分必要的,重要的是把握好先进性与实用性和适用性之间的关系,取两者之间的最佳平衡点,使用户的投资得到最大化的收益和回报。
注重售后服务
衡量设备及产品的优劣,不仅应以设备及产品本身的质量作为尺度,还应充分考虑厂商的售后服务。在系统正常使用情况下,软硬件的及时升级、维护,以及在系统出现故障时修复响应时间、备品备件的充足程度等,都将直接影响到整个系统的运行状况。因此,选择优秀的设备供应商和全面考察供应商的售后服务情况也是服务器系统选择中重要的原则之一。
3.2.7.2服务器系统选择的依据
服务器系统的运算能力和I/O能力往往是考察系统性能优劣的重要指标。目前较为普遍采用的一个衡量服务器系统处理能力的参数是TPMC值,TPMC值是测试单台服务器或集群系统在配备特定的操作系统,采用特定的数据库的情况下每分钟处理事务的能力(Transaction Per Minute)。TPMC值越高说明系统处理能力越强。
通常情况下,用户的应用每秒钟会触发几个事物这一基准数据的取值范围是可以定量计算的,这样针对某个联机事物处理系统,对系统服务器的选择就可以参照服务器的TPMC值来确定了。但是同时也应该看到,服务器TPMC值是通过实验手段取得的,某系统的TPMC值是在其生产厂商所送检的特定配置的服务器硬件 + 特定配置的操作系统 + 特定配置的数据库系统所得出的事物处理能力的衡量,其配置中任何一项的变化都可能会对TPMC值有很大的影响。例如在硬件和操作系统不变的情况下,改变数据库系统类型或它的配置,就可能在很大程度上改写系统的TPMC值,不可忽视的是,应用软件设计和编码的好坏能在更大程度上影响系统的事物处理能力。所以对TPMC值的作用,仅可以用作参考,不可以生搬硬套,按照一般的原则,选择服务器时一般对TPMC值要求要高一些。
3.2.7.3需求分析
需求分析
数据中心服务器系统的特点是业务复杂,处理数据量较多,连接用户数多,服务器的选型,主要应考虑以下几方面的因素:
服务器的运算能力
服务器的处理需要考虑对高峰时业务受理的实时响应,考虑业务的复杂性,服务器需要实时的与多个业务分系统进行数据采集、比对、整理和分发。需要服务器有很高的处理能力。
服务器的内存
服务器还需要对实时产生的数据进行实时汇总、分发。要实现汇总、分发的实时高效,需要将实时信息放入内存,进行处理,才能提高系统的性能,这样服务器需要有较高的内存。
高的I/O能力
对每天生成的数据需要实时入库,需要有很强的I/O能力,使得数据的入库不会成为系统的瓶颈。
系统扩展
在追求数据服务器单机高性能时,也需要考虑业务巨大时的系统负载的分流,系统在规划设计时,在软件设计上进行合理处理,使得应用可以在单机上运行,也可以有不同的服务器上进行任务分担,共同完成实时的业务处理。
3.2.7.4性能测算
服务器系统是整个数据中心的心脏,负责管理数据中心的基础信息、共享信息、各专业区域信息以及业务应用过程中发生的相关业务数据、以及数据管理的过程中产生的比对信息、整理信息、管理信息等,同时为各个分系统提供共享信息。
服务器的处理能力作用体现在每秒钟的事务处理数量上。事务处理主要包括卡业务受理、数据的实时汇总、入库、分发等功能。根据日业务量可以推算出服务器每秒需要处理的事务数。
服务器主要负责业务业务逻辑的实现和数据的处理,因此它的处理量主要表现在TPMC 即事务处理以及一些计算上,根据XX市数据中心应用模型,按照服务器支持100万/天的访问量,每个事务按0.2秒的响应时间计算,每天8小时,峰值为平均数的3倍计算,冗余30%,每个事务触发5个Transaction,每分钟处理的事务量:
=(100万/天)*3*130%*5/0.2/(8*60)
=20312Transaction/分钟
因此我们建议服务器的TPMC值为:20312
基于上述计算, 建议服务器采用TPC-C值在25,000左右的服务器系统。
3.2.8存储系统设计
3.2.8.1设计原则
由于XX市电子政务数据中心存储了所有相关的业务数据、统计数据等重要数据,存储系统作为数据存储的设备,对于它的可靠性要求很高。
存储设备必须满足以下需求:
存储系统必须具有高性能、高可靠性和足够的容错特性,提供多种信息保护、共享、管理方案,以保证信息的高可用性
必须拥有足够的系统扩充性,以支持目前社会保障的数据容量,同时还要考虑未来业务的发展。
高性能智能型企业存储,对主机CPU的性能无影响,将主机资源充分应用于业务系统,同时还要考虑未来业务的发展
具备多平台、企业级的连接能力,以便于主机的选型和系统的整合
满足作数据远程镜像备份(容灾)的要求
3.2.8.2主流存储技术比较及建议
1. 直连方式存储 (Direct Attached Storage-DAS)
存储设备是通过电缆(通常是SCSI接口电缆)直接到服务器。I/O请求直接发送到存储设备。这种方式是连接单独的或两台小型集群的服务器。
它的特点是初始费用可能比较低。可是这种连接方式下,对于多个服务器或多台PC的环境,每台PC或服务器单独拥有自己的存储磁盘,容量的再分配困难;对于整个环境下的存储系统管理,工作烦琐而重复,没有集中管理解决方案。所以整体的管理成本较高。
2. 网络连接存储(Network Attached Storage - NAS)
NAS设备通常是集成了处理器和磁盘/磁盘柜,类似于文件服务器。连接到TCP/IP网络上(可以通过LAN或WAN),通过文件存取协议(例如NFS,CIFS等)存取数据。NAS将文件存取请求转换为内部I/O请求。这种方式是将存储设备连接到基于IP的网络中,不同于DAS和SAN,服务器通过“File I/O”方式发送文件存取请求到存储设备NAS。NAS上一般安装有自己的操作系统,它将File I/O转换成Block I/O,发送到内部磁盘。NAS系统有较低的成本,易于实现文件共享。但由于它是采用文件请求的方式,相比块请求的设备性能差;并且NAS系统不适合于不采用文件系统进行存储管理的系统,如某些数据库。
3. 存储区域网络(Storage Area Network - SAN)
存储设备组成单独的网络,大多利用光纤连接,采用光纤通道协议(Fiber
Channel,简称FC)。服务器和存储设备间可以任意连接,I/O请求也是直接发送到存储设备。光纤通道协议实际上解决了底层的传输协议,高层的协议仍然采用SCSI协议,所以光纤通道协议实际上可以看成是SCSI over FC。存储区域网络的优点如下:
服务器和存储设备之间更远的距离(光纤通道网络:10公里相比较DAS的SCSI:25米);
高可靠性及高性能;
多个服务器和存储设备之间可以任意连接
集中的存储设备替代多个的存储设备,支持存储容量共享;
通过相应的软件使得SAN上的存储设备表现为一个整体,因此有很高的扩展性;
可以通过软件集中管理和控制SAN上的存储设备,提供数据共享
由于SAN通常是基于光纤通道的解决方案,需要专用的光纤通道交换机和管理软件,以SAN的初始费用比DAS和NAS高。
4.IP SAN
如果SAN是基于TCP/IP的网络,实现IP-SAN网络。这种方式是将服务器和存储设备通过专用的网络连接起来,服务器通过“Block I/O”发送数据存取请求到存储设备。最常用的是iSCSI技术,就是把SCSI命令包在TCP/IP 包中传输,即为SCSI over TCP/IP。
IP SAN的优势在于:
利用无所不在的以太网络,一定程度上保护了现有投资。
IP存储超越了地理距离的,适合于对关键数据的远程备份。
IP网络技术成熟,不存在互操作性问题
IP存储减少了配置、维护、管理的复杂度。
IP网络已经被IT业界广泛认可-网络管理软件和服务产品可供使用
千兆网的广泛使用大大提高了IP网络的性能
万兆网络技术的发展,使IP存储在性能上可以超越FC存储
总结:
性能上:FC性能最好,单端口可以达到2Gbps的带宽;NAS性能最差,即使采用千兆网络,通常只能30-40MBps;单千兆iSCSI可以达到60-70MBps;万兆网络下,单万兆口的速度可以超过500MBps。
扩展性上:FC和iSCSI采用SAN的架构,扩展性最好,在存储网络中,易于增加用户或增加存储模块。
应用成本上:FC的应用成本最高,需要配套的昂贵的光纤交换机(8端口光纤交换机大约3-4万元);每个服务器需要配光纤通道卡(光纤通道卡5000-1万元);以及采用光纤介质;相比之下,iSCSI只需要普通的以太网交换机(8端口千兆交换机1000元);服务器本身带有千兆网口,即使增加一个网卡也就是500元,采用普通的超五类线就可以,价格可以忽略不计;
市场定位:FC占据高端,iSCSI处于中高端,NAS和DAS处于低端
结论:综合比较San,Nas,ip-san等主流存储技术,建议使用IP-SAN实现。
3.2.8.3Raid类型配置建议
存储系统中主要的RAID技术有RAID0(条块化)、RAID0+1(条块化并镜像)、RAID5。采用RAID0技术最经济,存储空间利用率为100%,性能也最好,但是数据没有冗余保护,生产系统中一般不采用。RAID0+1技术性能仅次于RAID0,但经济性最差,存储空间利用率为50%,数据安全性最好。RAID5存储空间利用率超过80%,数据也有冗余保护,但性能差于RAID0+1,但在存储系统Cache比较大的时候性能也基本可以保证。
从应用需求看,应用对IO系统的传输带宽并不敏感,而对IO系统单位时间内能提供的IO次数要求比较高。同时,对文件处理和数据库批处理而言,鉴于单个文件或数据库表空间很南分配到不同的存储系统上,因此单个存储系统的IO指标越高越好。要提高IO系统在单位时间内的IO处理次数,可以通过配置比较好的RAID控制卡和比较大的读写Cache实现,但从节省投资方面考虑可以选择RAID5,应用软件中采用了许多先进的技术,如大内存处理、多进程多线程等技术,可以显著解决IO的瓶颈,因而RAID5也可以保证系统性能。
3.2.9灾备系统设计
3.2.9.1设计原则
为XX市电子政务数据中心提供灾备方案时,主要考虑以下三方面因素:
灾难承受程度:要明确用户计算机系统需要承受的灾难类型、系统故障、通信故障、长时间断电甚至火灾、地震等各种意外情况所采取的保护方案不尽相同;
业务影响程度:让用户必须明确当计算机系统发生意外无法工作时,导致业务停顿所造成的损失程度,也就是定义用户对于IT环境发生故障的最大容忍时间。这是我们设计灾难恢复方案的重要技术指标;
数据保护程度:是否要求数据库可以恢复所有提交的交易并且要求实时同步数据也就是数据的连续性和一致性,决定了灾难恢复方案规模和复杂程度的重要依据。
提供的灾难恢复方案可以满足XX市电子政务数据中心对于计算机系统、数据的严格保护要求,保证即使发生断电,火灾等严重灾难时,政务业务的相关关键数据不会丢失和缺损,确保业务数据在主中心和备份中心同步更新,保证数据最大的完整性。
3.2.9.2灾备技术比较
通常说来,灾难恢复方案建议用户建立两个数据中心,XX主数据中心和南宁备份数据中心。正常情况下,应用运行在主数据中心的计算机系统上,数据也存放在主中心的存储系统中。当主数据中心由于断电,火灾甚至地震等灾难无法工作时,则立即采取一系列相关措施,将网络、电话线路切换至备份中心,并且利用备份中心计算机系统重新启动应用系统。而这里最关键的问题就是切换过程时间最短,同时尽可能保持主数据中心和备份中心数据的连续性和完整性。而由于社保数据的重要性,如何解决主、备中心数据库数据备份,恢复则是灾难恢复方案的重点。
传统的磁带备份方式一般采取定点备份,而当系统崩溃时。距最近一次备份时间之间的数据将全部丢失,无法恢复。而且磁带备份和恢复时间比较长,由于速度慢,缺乏实时性,无法满足用户大数据量数据恢复及数据库连续性、实时性的要求。
现在流行的灾难恢复方案主要是采用硬盘备份的方式。它的主要原理是在备份中心建立一套硬盘存储系统,通过通信线路,实时地将主中心更新数据拷贝至备份中心存储系统中,保证主、备中心数据的实时一致性。当主中心无法工作时,备份中心可以立即接管业务,并且确保数据的最大完整性。其主要实施方法有以下三种:
利用数据库厂家的软件产品完成远程备份:现有的一些数据库厂家例如Oracle数据库可以提供STANDBY数据库功能,通过通信网络将实际数据库日志文件传至备份中心存储系统,备份中心的STANDBY数据库按照主数据库结构从日志文件中重新恢复数据库。这种方法投资成本小,数据恢复相对磁带较快,缺点就是占用主机资源,日志文件建立过程中发生灾难时,整个日志文件数据将丢失;
利用主机进行远程数据镜像:主中心存储设备与备份中心存储设备进行镜像,主机同时将数据分别写到本地和远程磁盘上。主机上安装灾备软件,如AIX上的HAGEO、SUN上的VERITAS(VERITAS Volume Replicator)等。这种方法优点就是可以保证数据的实时一致性,但是存储镜像通过主机完成,这将极大地影响主机性能,当由于通信故障,一个镜像操作无法完成时,主机将无法进行下一个写操作;
基于智能存储系统的远程数据复制: 磁盘阵列将磁盘镜象功能的处理负荷从主机转移到智能磁盘控制器 — 智能存储系统上。如IBM的PPRC、EMC的SRDF等,基于智能存储的数据复制由智能存储系统自身功能实现数据的远程复制和同步,即智能存储系统本身来完成数据的复制功能,同主机无关,不占用主机的CPU,连接可以采用裸光纤、ATM、E1/E2、T1/T3、TCP/IP等。由于这种方式下数据复制软件运行在存贮系统内, 因此较容易实现主中心和容灾备份中心的操作系统、数据库、系统库和目录的实时拷贝维护能力, 且一般不会影响主中心主机系统的性能。而且上层可以是不同主机平台。如果在系统恢复场所具备了实时数据,那么就可能做到在灾难发生的同时及时开始应用处理过程的恢复。
三种实施方法的比较:
第一种方案的最大缺点就是灾难发生时,系统数据备份可能不完全,丢失数据量较大,而且对系统正常工作时的系统性能影响较大。第二种方案由于远程备份要占用主机的CPU、I/O等资源,同时根据备份方式的不同,可能对主机的性能有一定的影响,但它能够保证数据备份的完整性。第三种方案能够完全确保数据的一致性,同时对主机系统的性能影响较小,对主机平台的要求也低,但缺点是系统投资较大。
3.2.9.3灾备解决方案
数据中心系统的主要数据存储包括两大部分:应用系统数据以及统计分析系统数据。两个业务特性的不同决定了我们需要考虑实施不同的数据备份策略。下表是我们针对其备份系统需要考虑的业务特性所进行的比较。
根据上表,我们知道,业务生产系统的数据备份工作以严密、最大限度保护数据、快速恢复为宗旨。而统计分析系统的数据备份工作以高效、简便,对数据起比较好保护作用为宗旨。
数据中心系统数据量很大,传统的LAN-Base以及Server-Base的备份方式难以满足XX市电子政务数据中心的需求,我们建议采用基于IP SAN架构的企业备份解决方案。
3.2.9.4备份策略
为了对业务生产系统数据实施良好的备份,最大限度保护数据,建议实施下列备份策略:
数据库运行在归档模式下;
每个礼拜对数据库进行一次完整的数据备份,数据库的完整备份保存2个版本,每个备份保存两个备份周期;
每天对数据库做增量备份,增量备份保存两个版本,每个备份保存两个全备周期;
每天对数据库进行归档日志文件的备份,每次备份时间间隔建议为30分钟,保存2个完整备份周期内的所有归档日志文件;
将配置信息表等存放在单独的表空间上,减少在类似数据丢失情况下进行数据库恢复的时间;
对单个重要的表可以采用export进行逻辑备份。逻辑备份可以考虑保留在本地硬盘上或者磁带上;
对备份数据的磁带进行异地保存。
3.2.10网络系统设计
3.2.10.1设计原则
1) 设备高性能
构建网络的组网技术必须是高带宽的组网技术;交换设备必须支持线速交换,以保证无阻塞的数据交换;
2) 设备先进性
所选的设备必须具有很好的扩展性,当网络规模或带宽需要扩展时,能够以最小的代价满足新的需求。
3)网络可靠稳定性
可靠稳定的网络平台,是应用业务系统得以实施和推广的基石。网络平台的设计必须从设备、网络拓扑结构、网络技术等几个方面保证网络的可靠稳定性。
4) 网络安全性
除了要保障网络平台的安全性,还需要在一定程度上保障应用业务系统和其它网络资源的安全。网络平台应该从几个方面保证网络安全:1)设备本身的访问安全 2)内部网之间资源访问安全 3)路由系统安全 4)互联网访问安全。
3.2.10.2网络系统设计
今后的数据中心的网络将建设在现有电子政务网络的基础上(详细设计见XX市电子政务网络设计方案)。
3.2.11安全保障体系
数据中心的安全保障体系是确保数据中心系统安全性,保障在不同的业务系统之间(包括核心业务以及各种相关业务系统)以数据中心为核心进行数据共享、数据存取、数据交换等过程中的全面安全性。
整个安全保障体系可分为:物理安全、网络安全、系统安全、应用软件安全和信息资源安全。数据中心的安全保障体系是贯穿整个体系架构每个层次各系统的。各子系统的设计与构建都要把安全保障作为关键部分。实现数据中心的安全保障不仅要从技术层面,还需要从管理层面考虑。
数据中心系统的安全隐患主要来自于外部侵入和内部破坏,系统的安全包含技术的安全、法律和制度的保障等,安全建设包括权限与认证体系、信息安全处理体系、信息传输安全体系等方面。
数据中心安全体系示意图
系统的每一层次均有安全性的问题,安全策略包括物理安全、网络安全、系统安全、应用安全、数据资源安全。同时从安全技术和安全管理机制两个方面提供安全保障。
3.2.11.1物理安全
物理安全实现主要包括机房安全和人员管理,具体细节详见数据中心安全子项目的说明。
3.2.11.2网络安全
通过合理部署安全防御系统(如防火墙、入侵检测等),并通过统一安全管理服务平台实现对各种不同的安全防御设备的统一管理、配置、监控、分析等,提供全面的、基于统一安全策略的网络安全防御,避免来自各个不同目的的攻击、干扰和非法访问问题。各种安全防御技术的主要功能如下表所示:
| 名 称 | 配 置 |
| 防火墙 | 在网络之间执行访问控制策略(在应用层之下)。通过拦阻机制或允许机制实现对跨网络的各种连接或访问进行控制,确保只有满足安全策略的信息流通行。 |
| 入侵检测 | 入侵检测系统采用安全监测控制器和探测器两级的分布式结构,探测器配置在网络的敏感部位进行信息的采集,而安全监测控制器则对所收集到的信息进行分析处理,判断网络是否遭到入侵攻击。 |
| 漏洞扫描 | 漏洞扫描系统负责定期或不定期地调用网络安全性分析、操作系统安全性分析软件对整个内部系统进行安全扫描和检测,及时发现网络新的安全漏洞并予以补救 |
| 病毒防治 | 提供全网一致的病毒防治系统部署和管理,负责对各类计算机病毒的检测与杀灭。提供病毒免疫方式包括病毒预防、病毒诊断、病毒杀灭、病毒检测等。 |
| 安全审计 | 对各种网络安全系统、接入实体的详细操作记录、各电子政务应用系统所产生的具体日志信息进行全面的整理和详细的分析统计,提供强大有效的查询、报表和分析功能以便于管理员使用。 |
系统安全包括:操作系统安全、数据库系统安全、应用服务器系统安全和Web服务器系统安全。
操作系统、数据库系统、应用服务器是数据中心系统应用的支撑系统级平台,数据和软件的丢失、篡改、窃取、非法复制、滥用等对系统造成的后果是灾难性的,对社会造成的影响是严重的。因此要求操作系统、数据库管理系统本身的安全级别应能达到GB17859-1999第3级安全标记保护的主要安全特性。
3.2.11.4应用程序安全
应用程序安全是构建在系统平台安全性之上的。结合数据中心的安全认证平台,在设计上,数据中心的每个应用程序需要有自己的安全模型,但在开发期间应遵循一组标准的指导原则。采用用户验证和用户授权、加密、数字签名、XML安全技术等手段从应用程序一级进行安全保障。
3.2.11.5数据安全
数据是信息系统的核心,数据安全是数据中心电子政务安全体系建设信息安全的重要组成部分。从数据中心数据流的分析来看,数据主要存在于两种状态中,一个是数据库中,一个是在传输过程中。
在数据交换的过程中,必须通过严格的加密机制以及用户身份验证机制保证数据交换的安全。
数据安全包括几个层面上的内容,包括:
系统层面上的安全:采用可靠的操作系统(C2级)保证系统对于用户口令、权限的验证。
网络层面上的安全:对主机进行IP地址的访问列表,可细化到每个协议的资料包程度。
数字证书层面的安全:采用CA认证,保证与资料中心进行资料交换的主机身份都是经过认证的。
交换层面上的安全:采用加密以及用户身份认证机制。
要达到数据安全的目的,至少要满足以下三点:首先需要对两种状态中的机密数据进行加密。其次,对核心数据的访问进行控制,再次定期对数据备份,防止意外发生。
3.2.11.5.1核心数据加密
数据加密是用来保证数据即使被窃取之后,也很难了解数据的内容。因为保税区的特殊情况,对数据的保密和安全要求极为严格,因此除了在数据通过网络传输过程的保密和安全采取有效措施外,还要对数据库中的静态数据(如账号、密码、签名信息和财务数据等)和系统配置信息等核心数据进行加密,在显示时通过用户程序进行解密。这样,防止有人直接读取数据库表数据,获知核心数据的内容,功能甚至可以防止站点管理员、数据库管理员对数据的窥视。
以上描述的功能可以在平台一级以统一的API提供数据加密的服务,核心数据的选择原则,需要根据应用的情况来决定。
3.2.11.5.2数据访问控制
访问控制是指通过应用一级的控制,来保证数据的访问安全和数据的操作安全。也就是说,只有通过认证而且经过授权的用户,才能浏览他权限范围之内的数据;只有通过认证而且经过授权的用户,才能进行他权限范围之内的应用功能的操作。
可以通过对应用程序的权限的细分来达到对应用程序使用数据范围的精确控制。
3.2.11.5.3数据传播和复制
因为数据中心的数据存储方式是集中式存储,基于这种情况,如果在不同数据库中存储的、同类数据的出现了不一致的现象,将在整体上对数据的可信度产生影响。因此,需要采用数据传播和复制+传播复制的统一规则来实现全局数据一致的问题,保障数据安全。
3.2.11.6整体安全策略的说明
数据中心系统的安全性是一个整体的安全性,任何一个层次的安全隐患都会造成整个系统的不安全。数据安全、应用安全和系统安全由数据中心项目负责保证,物理安全、网络安全、身份认证等由安全平台项目负责保证。数据中心与业务部门的数据交换网络是在内网,内网与公众网是安全隔离的,数据中心系统本身是在一个相对安全的网络环境中运行,因此,安全性的保障要考虑适度安全。安全平台提供安全基础设施、身份认证,清晰定义安全接口,数据中心基于安全平台进行系统、应用、数据的安全设计,并从整体上对数据中心的安全性进行优化。
3.2.5安全保障体系
3.2.5.1网络安全
3.2.5.2系统安全
3.2.5.3应用程序安全
3.2.5.4数据资源安全
3.2.5.4.1核心数据加密
3.2.5.4.2数据访问控制
3.2.5.4.3数据传播和复制
3.2.5.4.4数据备份
3.2.5.5整体安全策略说明
3.2.12数据中心典型应用
3.2.12.1政务数据交换平台
3.2.12.1.1运行模型
XX市数据交换平台基于市政务数据交换中心基础上进行建设,使用市政务数据交换中心目录管理服务建设政务数据共享目录,使用市政务数据交换中心数据交换平台实现政务数据各个成员单位的信息共享。
市政务数据交换中心目录管理服务支持多个专项目录,提供编目、注册、发布、修订、注销等目录管理功能,政务数据各成员单位使用市政务数据交换中心系统建设政务数据共享目录。XX市数据交换平台可以调用市政务数据交换中心的目录接口获取政务数据共享目录的信息,政务数据各成员单位用户既可以在市政务数据交换中心上使用政务数据共享目录,也可以在市数据交换平台中使用。
XX市数据交换平台使用市政务数据交换中心数据交换平台,实现成员单位之间的信息共享交换。政务数据共享成员单位同时也作为市政务数据交换中心的成员单位,接入市政务数据交换中心,形成数据共享交换网络。政务数据共享成员单位在市政务数据交换中心数据交换平台上进行政务数据信息共享。市政务数据共享信息库作为市政务数据中心的一个交换数据源,政务数据共享各成员单位共享的数据通过采集服务汇集到市政务数据共享信息库。市政务数据共享应用系统通过调用市政务数据交换中心交换管理接口获取政务数据共享交换服务运行情况,提供交换日志查询和统计等功能。
XX市数据交换平台总体运行过程如下:
(一)数据提供:政务数据共享成员单位开发交换桥接,从业务库中抽取对外共享的数据,写入本节点前置机的前置交换库中。
(二)数据采集:通过XX市政务数据中心交换中心,把数据由各个端节点采集到中心节点,形成中心交换库。
(三)系统衔接:通过XX市政务数据交换中心目录接口将共享目录数据同步到政务数据共享信息库;通过XX市政务数据交换中心分发政务业务数据到政务数据共享信息库。
(四)数据处理:对政务数据共享信息库中的政务信息进行处理和整合,形成基础库。
(五)应用支撑:基于政务数据共享信息库,建立政务数据共享应用系统,提供信息查询、信息预警、统计分析等功能。
3.2.12.1.2信息共享交换
政务数据共享应用系统使用市政务数据交换中心的交换平台,实现政务数据信息共享交换。同时,通过调用数据中心接口实现交换服务运行情况展现功能。
具体功能:调用数据中心接口展现交换总体交换情况、数据提供情况、数据获取情况,从多个角度展示交换情况。
3.2.12.1.3共享目录检索
政务数据共享应用系统使用市电子数据交换中心的目录管理服务,实现政务数据共享目录的管理维护。并且调用数据中心目录接口实现政务数据共享专项目录展现,提供目录查询和资源定位等功能。本模块具体功能如下:
(一)政务数据共享专项目录展现:以目录树方式展现政务数据共享成员单位的信息资源目录,方便用户定位资源及进行目录查询。
(二)目录查询及数据资源展现:提供目录查询功能,用户可以通过资源提供方、资源名称、关键字等多个查询条件定位数据资源;提供数据资源档案,可以查看资源的数据规格等信息。
3.2.12.1.4共享数据查询服务体系
决策信息,如国家和地方的、法规条例、决策咨询、战略发展研究报告(包括各职能机构和院所历年的研究成果)和阶段性的总体规划等;
社会服务信息,如国际国内重大政治新闻、经济运行分析、热点透视、社情动态、税收征管、统计报表、市场供求信息、社会与经济预测信息、金融财经信息、科技与人才信息,等等;
交流信息,部门之间因工作职能的需要交换信息,如各种公文、会议情况、总结报告、记录数据、办公文档、机关行政管理信息、经验介绍、驻外办事处等工作流信息。
应对事件预案,整个城市的各类资源要素储备和分布状况,行政组织及人力资源调配预案,对自然灾害和意外事故的处理,重大突发事件的应急预案。
城市地理信息,如城市地理状况、地下网、管、道和线的分布结构,以及城市规划与发展的思想库以及城市发展和行政的历史沿革等信息。
3.2.12.1.5业务数据整理
业务数据整理系统是数据中心的一个重要组成部分,是数据中心的门户,它实现不同业务数据平台之间的数据交换、共享和业务流程的对接,实现异构数据整合。
提供对各种数据库系统的访问能力,以实现异构数据库的互联。
提供不同数据格式间的自动转换能力,以保证各种格式的数据均能够按数据中心的规范格式存入数据库系统。
提供数据的过滤、填充功能,以实现抽取来源于各种系统的数据内容能够满足数据中心的要求。
提供数据库同步机制,以实现将各业务数据交换平台的中心数据库中的数据自动同步到数据中心的数据库中。
3.2.12.1.6决策支持系统
决策支持系统和数据仓库执行的都是决策和趋势分析类的应用。决策支持系统中的一些技术可以很好地集成到数据仓库中,使数据仓库的分析能力更加强大。例如:决策支持系统中的传统统计分析模型可以帮助用户对数据仓库中的数据进行更加有效、更加深入的分析,从而更好地掌握和利用信息。
数据挖掘是数据仓库应用中比较重要且相对的部分,它可以从数据仓库的海量数据中提取出人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。提取的知识以概念、规则、规律、模式等形式提供给用户。
数据仓库是面向决策分析的,具有从各种数据源抽取数据,并对数据进行清洗、聚集和转换等各种处理能力。从这个意义上说,数据仓库既是一个信息资源的存储机制,也是一个信息资源分析、处理的支持决策的系统。组织的决策行为依赖于信息资源的良好组织,因而基于数据仓库的信息资源存储必然成为主流的信息资源存储方式。
3.2.12.2企业基础信息共享系统
企业基础信息共享应用系统使用市电子政务数据中心的交换平台,实现综合治税信息共享交换。同时,通过调用数据中心接口实现交换服务运行情况展现功能。
主要功能包括:
(1)基于企业基础信息库,提供企业基础信息的综合查询、企业档案浏览以及企业信息统计等功能。
(2)通过将各单位提供的共享数据进行比对,形成应办未办税务登记、应办未办工商注销登记等信息预警,提供信息预警查询、游览和统计功能。
3.2.12.3社会保障信息共享系统
围绕社会保障信息共享工作的要求,建设社会保障信息共享专项应用系统,基于已有的社保各业务系统数据基础,提供信息预警功能,及时发现因信息不全而造成的管理漏洞,保障社会保险基金、残疾人就业保障金和住房公积金的征缴。
主要功能包括:
(1)专题信息共享交换:基于数据共享交换子系统,对专项成员单位之间的数据交换情况进行查询和统计。
(2)专题共享目录检索:将专项成员单位共享的业务信息组织成为专题共享目录,提供目录检索功能。
(3)专题共享数据查询:基于专题共享目录,提供共享业务信息查询功能。
(4)专题信息预警:通过共享业务信息的分析比对,及时发现问题隐患,产生预警。提供预警指标设置、预警信息查询、预警信息统计等功能。
3.2.12.4人事档案托管系统
依托XX市数据中心的信息化平台,建设面向XX及周边地区的网络化人事档案信息化管理系统,接受XX及周边地区国家机关、事业单位、国有企业、民营、三资企业等用人单位和个人的委托,提供人事档案托管、户籍关系托管、职称晋升申报、社会保险代缴等人事服务项目。除为个人与用人单位提供基本的查询、资料下载、信息发布与费用网上支付外,并努力在XX乃至广西首先实现电子人事档案,网上24小时业务办理等。
主要功能包括:
(1)数据录入功能:提供员工信息录入功能。可以录入员工的姓名、性别、年龄、民族、籍贯、职务编号等信息。
(2)数据查询功能:系统需提供以下查询功能。根据员工的编号查询员工的基本信息;根据员工的性别查询员工的信息;根据员工编号查询员工的职务变动信息。
(3)数据修改功能:在系统中管理员可以修改已有员工的信息,包括性别、年龄、民族、籍贯、职务编号等信息。
第4章、运营及保障机制
为保证数据中心建设的顺利进行和有效运行,必须有一套完善的运行管理机制和实用的运行管理系统来支撑。其中运行管理系统是运行管理机制的技术实现。
4.1运营机制
本项目建设和运营的关键在于系统服务的推广和运作。因此,本着“合作、共享、效率、品牌”的原则,遵守市场经济的规律,本项目采用投资建设,第三方公司运维的方式。本项目前期规划存储政务数据,中后期融入企业及商务数据,在项目建设期,以为项目建设主体,实行项目管理;在项目运行期,以第三方合作公司为运维主体,充分依靠、协会、中介组织等渠道作用,来推广本项目开展的各项服务。
4.2运行管理机制
运行管理机制的关键在于度的把握,要在众多可能互相矛盾的指标中找到平衡点。数据中心在建设和运行管理过程中需要把握信息公开与安全保密的度;由此形成信息共享与安全保密相结合的信息管理机制。为此,需要制定几个主要的制度:信息共享法规、数据安全管理法规和数据中心的运行管理制度。
4.3信息资源管理机制
信息过度公开容易造成信息不安全,隐私泄露等问题;信息过度保密又容易造成信息割据和信息壁垒,不利于信息化的发展。
为此需要对信息进行分类,哪些部门需要哪些信息,哪些部门可以获得哪些信息,做到“知必所需”,以共享为主题,以公开促应用,以安全为前提,以保密为手段建立一种信息公开与授权存取相结合、数据共享与信息保密相结合的机制。
(1)信息共享法规
该制度面向信息办和业务部门,实现对信息资源的开发利用。有关单位根据这一制度公开必要的信息,并获取其他部门公开的信息。信息公开是信息共享的前提,也是数据中心的运行基础,通过信息共享法规使各部门提供数据和使用数据有章可循。
(2)安全管理法规
该制度同样面向信息办和业务部门,实现对信息资源的安全管理。虽然数据共享是主题,但与此同时必须要有配套的安全保密制度,确保共享信息的合法使用,防止隐私的泄露造成的社会影响以及其他信息安全事故的发生。
4.4运行管理制度
数据中心的运行管理制度主要面向数据中心的工作人员,包括日常工作制度、备份制度等。明确数据中心的管理架构,实施岗位责任制,分工负责,共同把数据中心建设好,管理好。
通过定义一套数据中心的运行管理制度,可从行政的手段解决管理维护的问题,保证数据中心的安全可靠和高效运行。
第5章、数据中心预算预算经费
5.1总投资概算
| 编号 | 建设内容 | 合计 | 备注 |
| (万元) | |||
| 1 | 基础平台建设 | 75 | 包括服务器、IP SAN存储设备、操作系统,数据库、中间件、备份软件等 |
| 2 | 政务数据交换平台建设 | 120 | 市电子政务数据中心基础平台建设主要包括:目录管理服务子系统、共享业务管理子系统、数据共享交换子系统、共享数据管理子系统。 |
| 3 | 基础信息资源库建设 | 50 | 基础信息资源库建设包括:基础信息库、交换信息库以及目录资源库。以企业基础信息库为建设重点。 |
| 4 | 企业专项建设 | 80 | 以企业基础信息共享专项作为切入点,建设企业基础信息共享应用系统,实施市工商局、市质监局、市地税局和市国税局等四个部门之间的数据交换,提高税务登记率,加强市场监管,促进财税增收。 |
| 5 | 社保专项建设 | 80 | 以社会保障信息共享专项作为切入点,建设社会保障信息共享专项应用系统,实施市、市劳动保障局、市计生局、市民政局等四个部门之间的数据交换,改善社保资金的管理,加强监管,促进征收。 |
| 7 | 项目监理 | 8 | 约占项目总体费用2% |
| 8 | 项目实施 | 28 | 约占项目总体费用7% |
| 合计 | 441 | ||
| 编号 | 建设内容 | 合计 | 备注 |
| (万元) | |||
| 基础平台 | |||
| 1 | 硬件设备 | ||
| 2 | 中心数据库服务器 | 15 | 2台,采用双机热备方式,供数据中心支撑平台使用 |
| 3 | 中心应用服务器 | 10 | 2台,采用双机热备方式,供数据中心支撑平台使用 |
| 4 | 磁盘阵列系统 | 20 | 1套,含磁盘阵列、SAN交换机和磁盘阵列管理主机 |
| 5 | 数据备份服务器 | 5 | 1台,用于数据备份管理 |
| 6 | 系统软件 | ||
| 7 | 操作系统(服务器) | 5 | 共5套,Windows Server 2008 企业版4套,Windows Server 2008 标准2套,分别供中心数据库服务器、中心应用服务器、数据备份服务器使用 |
| 8 | 数据库软件(服务器) | 5 | 共1套,Oracle 11g DB (RAC) Enterprise Edition for Windows (100用户) |
| 9 | 应用中间件(服务器) | 10 | 共2套,WebLogic Server 10 for Windows,供中心应用服务器使用 |
| 10 | 备份软件 | 5 | 1套 |
| 政务数据交换平台 | |||
| 11 | 数据共享交换子系统 | 30 | 数据共享交换子系统主要实现三方面功能:一是实现与市电子政务数据中心交换平台对接,承接市电子政务数据中心提供的共享业务数据;二是面向市电子政务数据中心成员单位提供数据交换服务;三是为市电子政务应用系统提供数据共享服务接口。 |
| 12 | 目录管理服务子系统 | 30 | 目录管理服务系统提供面向共享信息资源的目录注册管理和目录服务功能。面向管理员提供资源编目、注册、发布、注销等目录管理的基本功能。面向使用者提供共享目录服务,提供按部门、信息分类等的共享信息资源定位浏览功能,提供按关键字精确或模糊匹配查询功能。 |
| 13 | 共享业务管理子系统 | 30 | 共享业务管理子系统提供成员单位管理、供需关系管理功能,面向各成员单位提供信息共享申请、信息共享授权等共享业务办理功能,支持使用方提出共享申请,管理方统筹各使用方的共享需求统一向提供方提出共享授权确认要求等功能。 |
| 14 | 共享数据管理子系统 | 20 | 共享数据管理子系统基于对主题、元数据、代码等的数据标准管理,提供对采集到市电子政务数据中心的数据进行校验、处理比对等数据处理功能,实现对自然人和法人单位基础信息的动态数据更新,关联交换数据和基础数据形成自然人、法人单位基础档案,并发现问题数据和差异数据。 |
| 15 | 系统配置管理子系统 | 5 | 系统配置管理子系统是支撑平台的一个基础子系统。 |
| 主要功能包括: | |||
| (1)共享域:提供政务信息资源共享域的信息配置功能。 | |||
| (2)全局配置:提供组织机构、系统信息等全局配置功能。 | |||
| 16 | 系统安全管理子系统 | 5 | 系统安全管理子系统是支撑平台的一个基础子系统。 |
| 主要功能包括: | |||
| (1)用户管理:提供用户、用户组、角色管理功能。 | |||
| (2) 权限控制:提供基于角色的权限管理功能。 | |||
| (3)操作日志:提供用户操作日志的查询和导出功能。 | |||
| 基础信息资源库 | |||
| 17 | 企业基础信息库 | 50 | 以工商的企业、个体户信息为基础,整合其他部门的数据,形成完整、准确的法人单位档案。 |
| 主要工作: | |||
| (1)各单位法人单位历史数据清洗比对 | |||
| (2)整合各单位法人单位历史数据,对企业基础信息库进行初始化,建立法人单位基础档案 | |||
| (3)采集各单位的法人单位业务信息,对法人单位库进行更新维护 | |||
| (4)关联法人单位基础信息和业务信息 | |||
| 专项建设实施 | |||
| 18 | 企业基础信息共享专项应用 | 80 | 围绕企业基础信息共享工作要求,建设企业基础信息共享专项应用系统,基于企业基础信息库,提供信息预警功能,及时发现应办未办税务登记等问题企业。 |
| 主要功能包括: | |||
| (1)专题信息共享交换:基于数据共享交换子系统,对专项成员单位之间的数据交换情况进行查询和统计。 | |||
| (2)专题共享目录检索:将专项成员单位共享的业务信息组织成为专题共享目录,提供目录检索功能。 | |||
| (3)专题共享数据查询:基于专题共享目录,提供共享业务信息查询功能。 | |||
| (4)专题信息预警:通过共享业务信息的分析比对,及时发现问题隐患,产生预警。提供预警指标设置、预警信息查询、预警信息统计等功能。 | |||
| 19 | 社会保障信息共享专项应用 | 80 | 围绕社会保障信息共享工作的要求,建设社会保障信息共享专项应用系统,基于已有的社保各业务系统数据基础,提供信息预警功能,及时发现因信息不全而造成的管理漏洞,保障社会保险基金、残疾人就业保障金和住房公积金的征缴。 |
| 主要功能包括: | |||
| (1)专题信息共享交换:基于数据共享交换子系统,对专项成员单位之间的数据交换情况进行查询和统计。 | |||
| (2)专题共享目录检索:将专项成员单位共享的业务信息组织成为专题共享目录,提供目录检索功能。 | |||
| (3)专题共享数据查询:基于专题共享目录,提供共享业务信息查询功能。 | |||
| (4)专题信息预警:通过共享业务信息的分析比对,及时发现问题隐患,产生预警。提供预警指标设置、预警信息查询、预警信息统计等功能。 | |||
| 项目管理和监理 | |||
| 20 | 项目监理 | 8 | 约占项目总体费用2% |
| 21 | 项目管理 | 28 | 约占项目总体费用7% |
| 合计 | 441 | ||
XX市电子政务数据中心项目的主要风险和应对措施如下:
(一)技术风险
主要体现在业务系统的多样性,可能造成系统接口复杂;另外负载估计不准确,可能造成数据中心的性能瓶颈。
针对接口的复杂性和多样性采取两个主要措施进行规避。一是按照既定的标准和规范统一建设数据中心接口系统;二是降低系统之间的耦合度,明确采用数据级整合方式实现松散耦合。
针对负载估计不准造成性能瓶颈,采用负载均衡技术,在必要时通过增加CPU、内存来扩展服务器处理能力。
(二)安全风险
数据集中到数据中心后,安全问题是一个非常关键的问题,如果安全管理跟不上,就可能造成数据的滥用,个人隐私泄露等。
针对安全隐患,从法规和技术两个方面保障。首先在法规上,要制定数据管理办法,在数据共享的情况下,保证数据的安全管理和合法使用。其次在技术上要构建安全保障体系,从物理层、网络层、系统层、应用层、数据层各个层面进行安全防护。
(三)数据质量风险
数据的质量取决于数据的权威性、一致性和完整性。数据多处采集,或者更新不及时,都将造成数据的不一致,影响数据中心的权威性。
针对数据质量问题,主要通过数据清洗、数据比对和冲突处理等手段提高数据的准确性。连接到数据中心的业务部门越多,数据更新越实时,数据的质量才能从根本上提高。
(四)实施风险
数据中心的建设依赖于各业务部门和有关单位的配合。配合得如何将影响项目能否成功实施。项目承建商是否具有数据中心的成功经验,也将影响项目的实施。
针对项目实施风险,一方面要加强沟通和协调,提高业务部门对数据中心的认识,毕竟从根本上说数据中心是共建共享共赢的;另一方面对数据中心的目标可以从低到高,首先是自然人、法人单位基础数据库的建设,然后再建设空间地理和宏观经济基础数据库,这将减少实施难度。
(五)管理风险
建设期内主要体现在关联项目多,项目管理难度大。建设期后主要体现在数据中心的管理部门不明确或者责权不匹配,造成运行管理困难。
针对管理风险,数据中心的运作关键在于运行机制,为此须尽快制定并颁布相关法规和标准规范,明确数据中心的管理职责分工。
(六)需求变更风险
数据中心涉及的部门众多,各部门的信息共享需求随业务而变化,在一定程度上存在需求变更和需求膨胀的风险。
针对需求变更和膨胀的风险,数据中心采用以下几方面的措施:一是增加需求调研时间,采用原型法方式进行多轮反复的调研分析,真正掌握各部门的信息共享需求;二是采用按需动态加载专题应用的方式,以新的专题来满足未来涌现的迫切需求;三是硬件设备是可以按需进行扩充,可以增加内容交换机以实现负载均衡,而不影响系统的整体运行;四是采用可扩展性强的软件平台,采用分布式、模块化的接口。
第7章、经济及社会效益
7.1经济效益
XX市电子政务数据中心建设的经济效益主要体现在:
避免重复建设,节省财政投资
电子政务数据中心建设统一的支撑平台和接口系统,避免了各个部门重复建设机房、重复购买服务器硬件设备和系统软件、重复开发接口程序,并且避免由此造成的接口复杂、管理困难、维护成本高等问题。电子政务数据中心对共享数据进行集中管理和维护,可以减少各部门单独管理和维护的成本,同时避免由此造成的数据不一致等问题。(以国内某兄弟城市某委局为例,原来和各个部门分别交换。要管理维护十多台前置机,现在通过市电子政务数据中心统一交换,只需要一台前置机)
7.2社会效益
XX市电子政务数据中心建设的社会效益主要体现在:
(1)有利于促进业务协同,提高行政效率
通过XX市电子政务数据中心实现部门之间的互联互通、资源共享,从而避免各个部门重复采集数据、重复录入,提高行政效率,有助于实现协同办公。
(2)有利于加强联合监管,提高管理水平
各个部门通过XX市电子政务数据中心共享其他部门的信息,全面、及时、准确掌握管理对象的情况,有助于实现精细化管理。信息共享可有效避免信息不对称造成的监管漏洞,有利于开展多个部门的联合监管。
(3)有利于提高公共服务水平,构建服务型
各部门通过XX市电子政务数据中心获取企业法人单位信息及其他部门的共享信息,可以开展主动服务,提供更人性化的服务,进一步方便居民和企业办事,促进服务型构建。
