1、“.....网站上发布的信息,如新闻动态政务公开 等等,般也是非结构化的信息。 此外,非结构化信息中还包括了类对象数据信息。所谓对象数据信息,是 指个包含了内敛结构的专门数据块,这个数据块单独无法建立与别的数据项的 关联关系,并且需要工作在特定的工作模块下。比如空间定义信息数据 多媒体的声像数据等,均为对象类型的数据。 在政府决策应用中,非结构化信息将占到相当的比例。所有的政府文件均属 于非结构化信息,政策法规属于非结构化信息,些决策分析的综合性资料也是 非结构化信息。 与结构化信息相比,非结构化信息的管理利用存在些难点,就是 定义管理的难度 非结构化表明了没有种象关系数据库规范那样的定义模型来对非结构 化信息进行定义管理。虽然你可以强制对个非结构化的信息块进行解构,将其 分成类似头中尾这样的半结构......”。
2、“..... 对非结构化信息进行定义管理的另个难点在于数据元类型无法穷举。不象 关系型数据系统中,对数据元类型有完整清晰的定义。在非结构化信息中,包含 了错综复杂的数据元类型。比如,仅文档类型就包括第页 等等,还有各种图片文件格式多媒体压缩信息格式等等。此外,在 象网页这样的非结构化信息中,所有的信息都是文字类型,设定时间数字等类 型的信息元并不具有运算上的意义。 存储管理的难度 对信息进行存储管理的前提是能够建立有效的数据定义,然后才能进行非结 构化信息的组织存放。而前面已经提到了在非结构化信息的数据定义方面存在的 难度,因此也就造成了在非结构化信息存储管理方面的困难。 当然,对非结构化信息最简单的存储方式是直接存放在文件系统中。这样做 避免了依据主题等分类因素对非结构化信息进行管理的问题......”。
3、“..... 在非结构化信息的存储管理中还涉及到个问题,由于这些信息元如果对 非结构化信息进行定的半结构化处理后的数据可能来自关系型数据系统比 如对象数据系统多媒体数据或空间数据乃至文档数据系统比如 ,所以个非结构化信息的存储管理系统将充当个数据的汇整者,需要 具备联合各个外部数据系统的功能。缺乏对非结构化信息的有效管理造成的直接 结果就是无法对非结构化信息进行有效检索。 信息检索的难度 由于不能像关系数据库那样建立起清晰定义的数据主题,非结构化信息的检 索依照的只能是机械的全文内容检索。 这是对信息检索非常不利的点。虽然对信息内容的全文检索可以做到资料 检索的遍历,但其检索的效率和命中率是很低的。由于不象关系数据库那样有 种象结构化查询语言那样强大的关联检索工具,并且在定义数据时也没 有建立数据项之间的关联关系,要具有针对性地查询非结构化信息的内容......”。
4、“.....才可 能提高信息检索的强度和效率。但另方面讲,种专用于理解特定非结构化信 息类型的处理模块,无论在运行效率还是在可维护性上,都是非常不现实的。非 结构化信息检索的另个难度也是与数据元类型的多样性有关的。比如,不同的第页 文档类型结构需要不同的全文索引工作模块。这也无形中加大了对非结构化信息 进行检索的难度。 因此,数据中心的建设,还必须从技术体系上解决如何对非结构化信息进行 有效定义有效管理和有效利用的基本问题。 系统及应用需求分析 数据中心的主要业务包括 从基层或业务部门采集数据,包括基础数据和部分共享业务数据,支持基础 和共享数据的更新维护模式 对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范 进行处理......”。
5、“.....并进行备案 对共享业务数据在征得业务部门同意的情况,通过数据中心进行存储转发 将共享元数据的信息发布给各业务部门,提供浏览与订阅申请,方便其共享 必要信息 提供数据交换平台和接口系统,使数据中心与各部门的数据管理员可以对共 享和交换过程进行管理 通过数据交换平台存储和管理公共服务数据,并与外网同步,提供站式服 务 存储和管理统计数据,根据决策支持的需要,整理相关数据,并提供统计分 析功能,对数据进行统计和分析,方便领导及时掌握有关情况。 定期对业务数据库进行容灾备份第页 与此相对应,业务部门与数据中心发生的相关业务包括 提供数据或共享元数据给数据中心 申请使用数据中心的基础数据......”。
6、“.....并将数据提供出去 与数据中心交换公共服务数据 提供监督部门直接访问业务数据库的通道 提供统计分析数据或原始个案给数据中心,方便主管领导查询 定期将业务数据库备份到数据中含义的编码和标准规范的编码之间进行双向的转换。 数据采集 与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总 数据,对原始数据进行缓存存储。 数据整理比对 从各业务部门采集共享数据后,进行数据转换,对全市自然人和法人基本数 据进行数据比对冲突检测处理并入库。 数据交换 实现业务部门与数据中心之间以及业务部门之间的数据交换业务,形成高 效安全可靠稳定的数据交换网络。提供定时批量实时按需的数据交换, 提供点对点对多的数据交换支持,对数据交换进行管理和监控。第页 数据访问 在统的权限管理系统之上......”。
7、“.....对社保卡系统公共服务中心系统业务系统提供数据访问。对决策支持系 统业务监管提供数据支持。 数据备份与恢复 恢复管理是对数据进行备份导入导出以及数据库恢复等。数据是数据中心 核心的资源。全面的容灾方式应该是数据备份数据复制远程容灾。对系统中的 数据要定期进行系统备份。采用本地备份与异地备份相结合的方式。 标准管理 进行数据中心的标准规范尤其是数据标准的审核制定升级维护与发布实施 等管理功能。在数据中心的建立之初,由于标准规范处于不断完善的过程,应建 立标准的版本管理机制,方便业务部门的查询和使用。 应用支持 对相关业务应用系统公共服务系统业务监管系统和决策支持系统提供提 供数据通道和平台等支持。 运行管理 为方便对数据中心的管理和维护,需要套功能完整的运行管理与监控维护 系统。运行管理系统主要提供给数据中心的系统管理人员使用......”。
8、“.....其功能主要包括面向安全性的用户管理权限管理 密码管理和日志管理等面向性能优化的性能监控等。面向可用性的节点管理 交换规则管理和状态监控其中节点管理包括对业务部门的信息管理。第页 性能需求分析 业务处理量分析 数据中心的主要业务包括 基础数据的采集转换比对以及分发 这是数据中心的主要负载压力所在。 业务数据交换的备案或存储转发 在数据中心建设初期,业务数据在业务部门之间交换当业务部门的接口系 统难以承受数据交换的负载时,才可能通过数据中心存储转发。所以这部分业务 不会对负载造成负载压力。 元数据库和公共代码库的管理和共享 由于元数据库和公共代码库相对稳定,并且数据量不是很大,所以不会对数 据中心造成负载压力。 与业务部门交换公共服务数据 由于业务不停地在发生,即使采用定时批量的交换方式,也会对数据中心造 成较大的负载压力......”。
9、“.....并提供查询 统计数据般按月提供,而且提交的般为结果数据,在数据交换方面不会 构成太大压力。领导的数据查询会形成少量的负载。 提供业务部门的容灾备份 容灾备份不需通过数据库服务器处理,所以不会对数据中心的负载构成压 力。 数据中心的主要负载压力在于两个方面,是基础数据的采集维护和使用 二是数据中心与业务部门之间的公共服务数据交换。下面我们分别进行分析。第页 基础数据的变动将引起数据中心的负载。首先业务部门需将变动数据交换给 数据中心,数据中心采集后进行转换和比对,然后进行发布,分发给有需要的部 门使用。 数据中心提供对公共服务系统的支持。各业务部门的公共服务业务数据通过 统的数据共享与交换平台即时或定时的交换到数据中心,保存到公共服务数据 库。再与外网的公共服务数据库同步......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。