1、“.....如市社会保险这个主题,实际上同保险工资税 务和银行密切相关个人信用使用主题,它的数据与银行税务个人消费个 人收入密切相关。而数据仓库显然也有面向主题的定义,但这些主题是较长时间 的,具有战略定义的主题。因此,数据中心的建设,首先要解决数据库异构信息 类型的分类存储和检索体系以及针对不同类型数据模型的设计这基本问题。 另方面,数据中心管理着大量的结构化和非结构化信息。所谓非结构化信 息,是相对于那些有清晰的结构和类型定义以及有数据相关性的明确描述的信息 类型而言的。比如,在财税分析系统中,财政收支情况的月度数据,可以理解为 种有清晰结构的信息而份综合性包含了文字报表分析图形的财政收支 分析报告则是种非结构化的信息。网站上发布的信息,如新闻动态政务公开 等等,般也是非结构化的信息。 此外,非结构化信息中还包括了类对象数据信息。所谓对象数据信息,是 指个包含了内敛结构的专门数据块,这个数据块单独无法建立与别的数据项的 关联关系......”。
2、“.....比如空间定义信息数据 多媒体的声像数据等,均为对象类型的数据。 在政府决策应用中,非结构化信息将占到相当的比例。所有的政府文件均属 于非结构化信息,政策法规属于非结构化信息,些决策分析的综合性资料也是 非结构化信息。 与结构化信息相比,非结构化信息的管理利用存在些难点,就是 定义管理的难度 非结构化表明了没有种象关系数据库规范那样的定义模型来对非结构 化信息进行定义管理。虽然你可以强制对个非结构化的信息块进行解构,将其 分成类似头中尾这样的半结构。但是这种解构只有在制定了具有普遍含义的 结构描述定义后才有真正的意义。 对非结构化信息进行定义管理的另个难点在于数据元类型无法穷举。不象 关系型数据系统中,对数据元类型有完整清晰的定义。在非结构化信息中,包含 了错综复杂的数据元类型。比如,仅文档类型就包括等等,还有各种图片文件格式多媒体压缩信息格式等等。此外,在 象网页这样的非结构化信息中,所有的信息都是文字类型......”。
3、“..... 存储管理的难度 对信息进行存储管理的前提是能够建立有效的数据定义,然后才能进行非结 构化信息的组织存放。而前面已经提到了在非结构化信息的数据定义方面存在的 难度,因此也就造成了在非结构化信息存储管理方面的困难。 当然,对非结构化信息最简单的存储方式是直接存放在文件系统中。这样做 避免了依据主题等分类因素对非结构化信息进行管理的问题,但也是最最低效的 种存储管理方式。 在非结构化信息的存储管理中还涉及到个问题,由于这些信息元如果对 非结构化信息进行定的半结构化处理后的数据可能来自关系型数据系统比 如对象数据系统多媒体数据或空间数据乃至文档数据系统比如 ,所以个非结构化信息的存储管理系统将充当个数据的汇整者,需要 具备联合各个外部数据系统的功能。缺乏对非结构化信息的有效管理造成的直接 结果就是无法对非结构化信息进行有效检索。 信息检索的难度 由于不能像关系数据库那样建立起清晰定义的数据主题......”。
4、“..... 这是对信息检索非常不利的点。虽然对信息内容的全文检索可以做到资料 检索的遍历,但其检索的效率和命中率是很低的。由于不象关系数据库那样有 种象结构化查询语言那样强大的关联检索工具,并且在定义数据时也没 有建立数据项之间的关联关系,要具有针对性地查询非结构化信息的内容,必须 要依靠应用程序中设置对特定非结构化信息类型进行专门处理的功能内容,才可 能提高信息检索的强度和效率。但另方面讲,种专用于理解特定非结构化信 息类型的处理模块,无论在运行效率还是在可维护性上,都是非常不现实的。非 结构化信息检索的另个难度也是与数据元类型的多样性有关的。比如,不同的文档类型结构需要不同的全文索引工作模块。这也无形中加大了对非结构化信息 进行检索的难度。 因此,数据中心的建设,还必须从技术体系上解决如何对非结构化信息进行 有效定义有效管理和有效利用的基本问题。 系统及应用需求分析 数据中心的主要业务包括 从基层或业务部门采集数据......”。
5、“.....支持基础 和共享数据的更新维护模式 对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范 进行处理,保证数据的致性和准确性 受理业务部门或基层单位的基础数据使用申请 将整理后的基础数据分发或按需提供给有关部门或单位使用 以中介的方式处理共享业务数据使用申请,并进行备案 对共享业务数据在征得业务部门同意的情况,通过数据中心进行存储转发 将共享元数据的信息发布给各业务部门,提供浏览与订阅申请,方便其共享 必要信息 提供数据交换平台和接口系统,使数据中心与各部门的数据管方面讲,种专用于理解特定非结构化信 息类型的处理模块,无论在运行效率还是在可维护性上,都是非常不现实的。非 结构化信息检索的另个难度也是与数据元类型的多样性有关的。比如,不同的文档类型结构需要不同的全文索引工作模块。这也无形中加大了对非结构化信息 进行检索的难度。 因此,数据中心的建设......”。
6、“..... 系统及应用需求分析 数据中心的主要业务包括 从基层或业务部门采集数据,包括基础数据和部分共享业务数据,支持基础 和共享数据的更新维护模式 对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范 进行处理,保证数据的致性和准确性 受理业务部门或基层单位的基础数据使用申请 将整理后的基础数据分发或按需提供给有关部门或单位使用 以中介的方式处理共享业务数据使用申请,并进行备案 对共享业务数据在征得业务部门同意的情况,通过数据中心进行存储转发 将共享元数据的信息发布给各业务部门,提供浏览与订阅申请,方便其共享 必要信息 提供数据交换平台和接口系统,使数据中心与各部门的数据管理员可以对共 享和交换过程进行管理 通过数据交换平台存储和管理公共服务数据,并与外网同步,提供站式服 务 存储和管理统计数据,根据决策支持的需要,整理相关数据,并提供统计分 析功能,对数据进行统计和分析,方便领导及时掌握有关情况......”。
7、“.....业务部门与数据中心发生的相关业务包括 提供数据或共享元数据给数据中心 申请使用数据中心的基础数据,校准本单位的基础数据 通过数据中心提供的共享元数据信息获取其他单位的数据 审批其他单位的业务数据使用申请,并将数据提供出去 与数据中心交换公共服务数据 提供监督部门直接访问业务数据库的通道 提供统计分析数据或原始个案给数据中心,方便主管领导查询 定期将业务数据库备份到数据中心 根据数据中心与各业务部门的主要业务,数据中心应提供如下功能 节点管理 实现与数据中心相连的各个节点的信息管理配置管理,包括业务部门区 县数据中心等。 主题管理 数据采集数据发布数据共享数据交换公共服务以及决策支持均以主 题的方式进行,因此必须实现对主题的管理。主题是元数据的集合。 元数据管理 元数据是关于数据的数据。元数据描述了数据的结构和意义,同时也可以描 述应用程序和流程的结构和意义。构造数据中心数据库的重要步骤之......”。
8、“.....元数据提供个目录,列出数据中心有什么数据。 所有进入数据中心的数据,必须在元数据中有所表述。数据中心的数据管理系统必须提供储存和管理元数据的方法。以元数据管理为核心,建立数据中心的数据 资源目录体系,提供给业务部门参考使用。 数据中心的元数据包括基础数据元和共享数据元,由数据中心统管理。基 础数据元由数据中心定义,共享数据元由业务部门定义并注册到数据中心。业务 部门进入数据中心的元数据管理中心好比进了个超市,可以方便地知道可 以获取和使用哪些数据,并进行数据使用申请的定制。 公共代码管理 对公共代码需要有统的标准规范,数据中心必须提供公共代码的管理。基 于数据中心的公共代码规范,各部门和区县数据中心可以通过数据转换将各种不 同含义的编码和标准规范的编码之间进行双向的转换。 数据采集 与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总 数据,对原始数据进行缓存存储。 数据整理比对 从各业务部门采集共享数据后......”。
9、“.....对全市自然人和法人基本数 据进行数据比对冲突检测处理并入库。 数据交换 实现业务部门与数据中心之间以及业务部门之间的数据交换业务,形成高 效安全可靠稳定的数据交换网络。提供定时批量实时按需的数据交换, 提供点对点对多的数据交换支持,对数据交换进行管理和监控。数据访问 在统的权限管理系统之上,实现对自然人和法人的建档调档阅档等业 务。对社保卡系统公共服务中心系统业务系统提供数据访问。对决策支持系 统业务监管提供数据支持。 数据备份与恢复 恢复管理是对数据进行备份导入导出以及数据库恢复等。数据是数据中心 核心的资源。全面的容灾方式应该是数据备份数据复制远程容灾。对系统中的 数据要定期进行系统备份。采用本地备份与异地备份相结合的方式。 标准管理 进行数据中心的标准规范尤其是数据标准的审核制定升级维护与发布实施 等管理功能。在数据中心的建立之初,由于标准规范处于不断完善的过程,应建 立标准的版本管理机制,方便业务部门的查询和使用......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。