当前位置:首页 > 大数据中心项目可行性研究报告
大数据中心项目可行性研究报告
3.2 数据中心平台设计
3.2.1 平台总体架构
3.2.2 数据资源规划
数据资源是数据中心最重要的资源。数据中心的数据资源分布状态具有阶段性,每个阶段都对应数据资源整合的不同阶段,体现数据资源的管理集中、有机分布的特点。根据“基于数据,围绕数据,面向数据”的建设思路,我们进行数据资源体系的总体规划,然后具体描述共享型的共享数据库、操作型的业务数据库和分析型的历史数据库这三类数据资源的构建、维护和使用。 3.2.2.1 数据资源规划的总体思路
数据资源规划的总体思路主要包括如下几个方面: ? 数据共享标准化
第16页
大数据中心项目可行性研究报告
首先共享数据是标准的,其次共享的方法和途径是规范的。目前各系统数据资源数据库已经有多种存在方式,要解决系统间信息的互连、互通、互操作,必须针对共享数据建立共同遵守的标准规范,只有编码是统一的、格式是统一的、数据交换的方式是统一的,才能保证数据是一致的,才能实现对数据交换和数据共享的有效管理。
? 业务数据相对独立
各职能部门分管业务的范围和职责不同。因此,系统在全局考虑、统一设计的同时,还要充分考虑不同业务部门自身的特点,在统一规划的前提下,保证支持不同业务活动的数据具有相对独立性,建立面向各部门进行联机事务处理的业务数据库。
? 决策数据集成化
建设数据中心的另一个目的就是将各部门的业务结果数据有机地集成在一起,进行综合查询和统计分析,为各级领导的决策提供有力的数据支持。 3.2.2.2 数据资源体系结构
分析型的历史数据库统计分析数据仓库共享型的共享数据库操作型的业务数据库人口数据库法人单位数据库公共服务数据库公共信息数据库社保业务数据劳动业务数据...社保卡系统数据库 数据中心数据资源体系结构
对公共服务系统、业务应用、决策分析提供支持,数据中心的数据库包含如
第17页
大数据中心项目可行性研究报告
下内容:
? 共享数据库,包含:自然人基础数据、法人基础数据库、元数据库、标
准代码库、共享业务数据(如果业务部门之间通过数据中心进行数据交换)。
? 统计分析数据库,汇集各业务部门的统计分析数据,为决策提供数据支
持。
? 运行管理数据库,用于监控管理、节点管理、日志等。 ? 公共服务数据库,提供对公共服务系统的数据支持。
3.2.2.3 共享数据一致性的保证
共享数据包括自然人和法人基础数据及其元数据和标准代码数据、共享业务数据。共享数据一致性问题是数据中心面临的关键问题。从范围上划分,共享数据包括基础数据,基础数据包含基准数据。
? 基准数据
基准数据是指唯一表示自然人和法人的数据字段集合,自然人有身份证号码和姓名标识,法人有法人机构代码和名称标识。基准数据主要来源是市公安局和市质监局。基准数据必须保证在整个社会保障信息系统是一致的,将来扩展到整个电子商务系统是一致的。市公安局和市质监局负责将更新的信息交换到数据中心;市数据中心负责汇总数据,进行比对整理校验,形成一致的基准数据,通过数据共享与交换平台分发给市级各业务部门和区数据中心;由业务部门/区数据中心校验更新自身的基准数据,保证基准数据的一致性。基础更新频度要达到每天更新甚至实时更新。数据的传递和分发通过数据交换平台实现。
? 基础数据
基础数据是指自然人和法人的常用基本信息,各业务部门日常管理都需要用到的面向主题的数据。基础数据包括自然人和法人的基准数据和其他元数据。主
第18页
大数据中心项目可行性研究报告
要来源是市级业务部门和区数据中心。基础数据一致性必须建立于基准数据一致性的基础上。基础数据的一致性也需要通过数据共享与交换平台和相应的机制、管理办法来保证。各部门按照业务职能明确元数据维护责任和权限,定期将在办理业务过程中更新的元数据项数据提供给数据中心;数据中心根据基准数据一致性的原则,对各业务部门提供的数据进行比对校验,正确的数据增加或更新到数据库中,并每天按照各业务部门业务要求,将更新数据分发到各业务信息系统;各业务部门可以直接使用这部分数据作为支撑行政业务和行政管理的数据资源,也可以作为业务参考信息。基础数据的范围将随着元数据范围的扩大而扩大。这部分数据同时可作为社保卡的数据。基础数据更新的频度,按照元数据使用的频度分别定义,通过部门协商机制研究确定,最低要求每周更新,一般每天更新,业务关联度较高的信息,要实现实时更新。数据的传递和分发通过数据交换平台实现。
? 元数据标准和标准代码数据
元数据标准和标准代码数据由市数据中心维护更新,并发布给各业务部门和区数据中心使用,由于业务部门系统内部沿用的代码可能与数据中心的发布版本不一致,业务部门需保证与其他业务部门进行共享交换的数据必须遵循数据中心的标准规范,而在系统内部可以采取逐步过渡迁移的方案,尽量减少影响业务运作。
? 共享业务数据
共享业务数据是指多个业务部门之间需要共享使用的数据,作为各业务部门进行行政管理的参考数据。数据来源渠道包括市级业务部门、区级数据中心、社会保障卡和公共服务等业务运营机构。共享业务数据以业务数据的发生地管理部门为准。这类数据由各业务部门按业务需求和协商的频度提供给数据中心,在数据中心处提供各部门查询。由于这类数据量比较大,预计可以分业务、分批更新。 3.2.2.4 共享数据库的建立过程
共享数据库的建立采取逐步扩展的策略,达到数据整体上的一致性、完整性和准确性是一个逐步完善的渐进式递归过程。共享数据库的建立由业务驱动,
第19页
共分享92篇相关文档