1、“.....不象关系型数据系统中,对数据元类型有完整清晰的定义。在非结构化信息中,包含了错综复杂的数据元类型。比如,仅文档类型就包括第页等等,还有各种图片文件格式多媒体压缩信息格式等等。此外,在象网页这样的非结构化信息中,所有的信息都是文字类型,设定时间数字等类型的信息元并在财税分析系统中,财政收支情况的月度数据,可以理解为种有清晰结构的信息而份综合性包含了文字报因此,数据中心的建设,首先要解决数据库异构信息类型的分类存储和检索体系以及针对不同类型数据模型的设计这基本问题。另方面,数据中心管理着大量的结构化和非结构化信息。所谓非结构化信息,是相对于那些有清晰的结构和类型定义以及有数据相关性的明确描述的信息类型而言的。比如,在财税分析系统中,财政收支情况的月度数据,可以理解为种有清晰结构的信息而份综合性包含了文字报表分析图形的财政收支分析报告则是种非构化信息......”。
2、“.....比如另方面,数据中心管理着大量的结构化和非结构化信息。因此,数据中心的建设,首先要解决数据库异构信息类型的分类存储和检索体系以及针对不同类型数据模型的设计这基本问题。部分内容简介同各个局委办的信息密切相关,但又是面第页向主题的,如市社会保险这个主题,实际上同保险工资税务和银行密切相关个人信用使用主题,它的数据与银行税务个人消费个人收入密切相关。而数据仓库显然也有面向主题的定义,但这些主题是较长时间的,具有战略定义的主题。因此,数据中心的建设,首先要解决数据库异构信息类型的分类存储和检索体系以及针对不同类型数据模型的设计这基本问题。另方面,数据中心管理着大量的结构化和非结构化信息。所谓非结构化信息,是相对于那些有清晰的结构和类型定义以及有数据相关性的明确描述的信息类型而言的。比如,在财税分析系统中......”。
3、“.....可以理解为种有清晰结构的信息而份综合性包含了文字报表分析图形的财政收支分析报告则是种非结构化的信息。网站上发布的信息,如新闻动态政务公开等等,般也是非结构化的信息。此外,非结构化信息中还包括了类对象数据信息。所谓对象数据信息,是指个包含了内敛结构的专门数据块,这个数据块单独无法建立与别的数据项的关联关系,并且需要工作在特定的工作模块下。比如空间定义信息数据多媒体的声像数据等,均为对象类型的数据。在政府决策应用中,非结构化信息将占到相当的比例。所有的政府文件均属于非结构化信息,政策法规属于非结构化信息,些决策分析的综合性资料也是非结构化信息。与结构化信息相比,非结构化信息的管理利用存在些难点,就是定义管理的难度非结构化表明了没有种象关系数据库规范那样的定义模型来对非结构化信息进行定义管理。虽然你可以强制对个非结构化的信息块进行解构,将其分成类似头中尾这样的半结构......”。
4、“.....对非结构化信息进行定义管理的另个难点在于数据元类型无法穷举。不象关系型数据系统中,对数据元类型有完整清晰的定义。在非结构化信息中,包含了错综复杂的数据元类型。比如,仅文档类型就包括第页等等,还有各种图片文件格式多媒体压缩信息格式等等。此外,在象网页这样的非结构化信息中,所有的信息都是文字类型,设定时间数字等类型的信息元并不具有运算上的意义。存储管理的难度对信息进行存储管理的前提是能够建立有效的数据定义,然后才能进行非结构化信息的组织存放。而前面已经提到了在非结构化信息的数据定义方面存在的难度,因此也就造成了在非结构化信息存储管理方面的困难。当然,对非结构化信息最简单的存储方式是直接存放在文件系统中。这样做避免了依据主题等分类因素对非结构化信息进行管理的问题,但也是最最低效的种存储管理方式。在非结构化信息的存储管理中还涉及到个问题......”。
5、“.....所以个非结构化信息的存储管理系统将充当个数据的汇整者,需要具备联合各个外部数据系统的功能。缺乏对非结构化信息的有效管理造成的直接结果就是无法对非结构化信息进行有效检索。信息检索的难度由于不能像关系数据库那样建立起清晰定义的数据主题,非结构化信息的检索依照的只能是机械的全文内容检索。这是对信息检索非常不利的点。虽然对信息内容的全文检索可以做到资料检索的遍历,但其检索的效率和命中率是很低的。由于不象关系数据库那样有种象结构化查询语言那样强大的关联检索工具,并且在定义数据时也没有建立数据项之间的关联关系,要具有针对性地查询非结构化信息的内容,必须要依靠应用程序中设置对特定非结构化信息类型进行专门处理的功能内容,才可能提高信息检索的强度和效率。但另方面讲......”。
6、“.....无论在运行效率还是在可维护性上,都是非常不现实的。非结构化信息检索的另个难度也是与数据元类型的多样性有关的。比如,不同的第页文档类型结构需要不同的全文索引工作模块。这也无形中加大了对非结构化信息进行检索的难度。因此,数据中心的建设,还必须从技术体系上解决如何对非结构化信息进行有效定义有效管理和有效利用的基本问题。系统及应用需求分析数据中心的主要业务包括从基层或业务部门采集数据,包括基础数据和部分共享业务数据,支持基础和共享数据的更新维护模式对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范进行处理,保证数据的致性和准确性受理业务部门或基层单位的基础数据使用申请将整理后的基础数据分发或按需提供给有关部门或单位使用以中介的方式处理共享业务数据使用申请,并进行备案对共享业务数据在征得业务部门同意的情况......”。
7、“.....提供浏览与订阅申请,方便其共享必要信息提供数据交换平台和接口系统,使数据中心与各部门的数据管理员可以对共享和交换过程进行管理通过数据交换平台存储和管理公共服务数据,并与外网同步,提供站式服务存储和管理统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,对数据进行统计和分析,方便领导及时掌握有关情况。定期对业务数据库进行容灾备份第页与此相对应,业务部门与数据中心发生的相关业务包括提供数据或共享元数据给数据中心申请使用数据中心的基础数据,校准本单位的基础数据通过数据中心提供的共享元数据信息获取其他单位的数据审批其他单位的业务数据使用申请,并将数据提供出去与数据中心交换公共服务数据提供监督部门直接访问业务数照主数据库结构从日志文件中重新恢复数据库。这种方法投资成本小,数据恢复相对磁带较快,缺点就是占用主机资源......”。
8、“.....整个日志文件数据将丢失利用主机进行远程数据镜像主中心存储设备与备份中心存储设备进行镜像,主机同时将数据分别写到本地和远程磁盘上。主机上安装灾备软件,如上的上的等。这种方法优点就是可以保证数据的实时致性,但是存储镜像通过主机完成,这将极大地影响主机性能,当由于通信故障,个镜像操作无法完成时,主机将无法进行下个写操作基于智能存储系统的远程数据复制磁盘阵列将磁盘镜象功能的处理负荷从主机转移到智能磁盘控制器智能存储系统上。如的的等,基于智能存储的数据复制由智能存储系统自身功能实现数据的远程复制和同步,即智能存储系统本身来完成数据的复制功能,同主机无关,不占用主机的,连接可以采用裸光纤等。由于这种方式下数据复制软件运行在存贮系统内,因此较容易实现主中心和容灾备份中心的操作系统数据库系统库和的实时拷贝维护能力,且般不会影响主中心主机系统的性能......”。
9、“.....如果在系统恢复场所具备了实时数据,那么就可能做到在灾难发生的同时及时开始应用处理过程的恢复。三种实施方法的比较第种方案的最大缺点就是灾难发生时,系统数据备份可能不完全,丢失数据量较大,而且对系统正常工作时的系统性能影响较大。第二种方案由于远程备第页份要占用主机的等资源,同时根据备份方式的不同,可能对主机的性能有定的影响,但它能够保证数据备份的完整性。第三种方案能够完全确保数据的致性,同时对主机系统的性能影响较小,对主机平台的要求也低,但缺点是系统投资较大。灾备解决方案数据中心系统的主要数据存储包括两大部分应用系统数据以及统计分析系统数据。两个业务特性的不同决定了我们需要考虑实施不同的数据备份策略。下表是我们针对其备份系统需要考虑的业务特性所进行的比较。根据上表,我们知道,业务生产系统的数据备份工作以严密最大限度保护数据快速恢复为宗旨。而统计分析系统的数据备份工作以高效简便......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。