1、“.....它们都是负的。兼容性的概念不能从索引中分离出来。兼容性的概念与传统数据库不同。这是因为旨在存储非结构化的异构数据,以便任何类型的数据都可以存储到中。容量不是的缺點,而是优点。但读取的性能主要由表的索引决定。的兼容性是基于数据可以很快从查询到的条件之上。在此前提下的兼容性才是有意义的。于是索引的设计变得非常重要。适应多源数据已经实现种方法是从和中清除数据,然后将数据转换成和的格式。但在本文中,我们并没有对该方法的性能进行分析容量和随机读写或大量读写要求。实验设计针对我们的数据模型,表设计方案和我们关注的问题,我们设计了如下实验我们从电网中选择了种作为我们实验的数据源。在电网分析系统中,从多个数据源查询数据是个非常普遍的请求,此情景下,操作将会十分频繁。比较模式是设计张分开的表。每个表包含个数据源的数据......”。
2、“.....数据源和的记录数量均与监控设备同时记录的参数数据相同。我们在个条件下进行了测试,在每个条件下,和的分离表分别包含和条指定设备的记录。表中比较了表的设计。将操作执行到大表中以获取所需的数据,并且适用于电网多元数据的通用事件驱动型数据模型论文原稿,人类产生的数据量迅速接近,数据量如此之大,超过了传统关系数据库的处理能力,例如和。为了克服传统数据库的容量问题,谷歌设计并实现了和来支持它们的事务。之后,软件基金会开发了开源软件。是种用于处理分布式数据集的框架。和都是其中的模块。在框架的基础上,开发了许多软件,如等,以处理不同类型的计算需求。是运行在之上的种由和的分离表分别包含和条指定设备的记录。表中比较了表的设计。将操作执行到大表中以获取所需的数据,并且操作执行在相应的分离表上。每种试验都记录并计算时间消耗。摘要作为种面向列的分布式的高容错的数据库......”。
3、“.....逐渐被制造业所采用。电网通常从多元数据源中产生大量的数据。与服务于关系查询的传统关系数据库不同,中操作性能很低。在的应用中,如何存储数据以保证运算和随机读取的充分性能是必须解决的关键问题。在本文中,我们提出了种事件驱动型的数据模型来解决这个问题。在我们的数据模型中,了个虚拟列族层。我们的表设计方案是从和个方面实现的,而由虚拟列族和组成。为了消除物理环境的干扰,每种大表的操作和分离表的操作分别执行了次每个实验的最终结果都是这个数字的平均值。结果和讨论在图中,每个数据点都显示了执行操作到大表和个分离表的时间消耗。我们可以看到,大多数情况下,扫描大表的时间消耗比扫描张分开的表要小。在图中,每栏显示了在不同指定数据采集条件下分别对大表和个分离表执行操作的平均时间消耗。这也表明,大表的平均时间消耗小于分离表。在图,我们可以看到......”。
4、“.....兼容性的概念与传统数据库不同。这是因为旨在存储非结构化的异构数据,以便任何类型的数据都可以存储到中。容量不是的缺點,而是优点。但读取的性能主要由表的索引决定。的兼容性是基于数据可以很快从查询到的条件之上。在此前提下的兼容性才是有意义的。于是索引的设计变得非常重要。适应多源数据已经实现种方法是从和中清除数据,然后将数据转换成和的格式。但在本文中,我们并没有对该方法的性能进行分析,而是提出了种混合模型。该方法的主要贡献在于提高了高。集成了些优化阅读特性的方法。被集成到中以加快查询速度,但它只能加速操作,这意味着从表中随机读取的性能可以用布隆过滤器进行改进,但布隆过滤器不能改善扫描操作的性能。由于是个非关系型数据库,由于是个非关系型数据库,因此,除了无法加速扫描操作之外,还不支持操作,这是它的个主要缺陷。但数据之间的关系是普遍而重要的......”。
5、“.....要找到潜在的有价值的关系或信息,查询多源数据是个普遍的需求。为了解决这个问题或优化操作,已经做了很多工作。是个提供类似故大表的时间消耗比分离表的要小从等式中我们可以得出将操作集成到表中的性能要优于在客户端实现操作。从电网数据中存储多源数据到的主要问题有两个问题不支持操作,以及多源数据兼容性方面的问题。为了解决不支持操作的缺陷,已经有大量的研究工作围绕其展开。但这些工作主要集中于操作在或方面的优化。为了适应使用的多数据源的数据,有人对此做了许多研究,并提出了些数据模型。但在这些方法中没有讨论操户端调用请求到主节点,然后在主节点上运行的进程查找以获取表数据库的位置。在表数据库中我们可以找到存储我们查询的数据区域的位置。旦确定了区域的位置,并将位置信息发送回客户端,客户端就直接与存储所需数据的从节点进行通信......”。
6、“.....进程在从属节点上处理读取请求,并将数据返回给客户端。将数据从服务器返回到客户端的过程前要进行操作的准备过程。对个特定的集群来说,操作的准备时间约为个定值同时,数据传输过程也会造成定程度的时间损耗。查询数供类似的接口的成熟而流行的工具,它支持操作。但是,的查询性能很差,执行操作的其他部分是在环境中完成的。在环境中,是在过程或过程中实现的,或者是者共同实现的。由于是个并行的计算框架,所以并行性能提高了的性能。但方法的缺点是,结果必须被写入或。而的设置过程非常耗时。因此不适用于在线分析过程,而只适用于大批量的线下的分析。另方面,多源数据的兼容性是大多数应用程序的共同要求。适用于电网多元数据适用于电网多元数据的通用事件驱动型数据模型论文原稿的接口的成熟而流行的工具,它支持操作。但是,的查询性能很差,执行操作的其他部分是在环境中完成的。在环境中,是在过程或过程中实现的......”。
7、“.....由于是个并行的计算框架,所以并行性能提高了的性能。但方法的缺点是,结果必须被写入或。而的设置过程非常耗时。因此不适用于在线分析过程,而只适用于大批量的线下的分析。另方面,多源数据的兼容性是大多数应用程序的共同要求。查,并确定了我们想要解决的问题在第章我们提出了种设计方案和虚拟列族机制的概念来解决这个问题,并分析了的读取数据和的存储层次以及我们方案的优势在第章,我们建立并实施实验验证了我们的方案。实验结果保证了我们推论的合理性。所以在第章我们证明了我们的方案是正确和有效的。相关工作和问题的确立相关工作大数据技术已被广泛应用于电网系统。和是电网数据中心的基础设施。存储这些详细数据的主要目的是评估设备的状态,避免设备异常引起的损坏。在这种情况下,从读取数据是很常见的。然而,从读取的数据量也许很小,但大多数情况下,阅读数据的频率都很进行了调查......”。
8、“.....并分析了的读取数据和的存储层次以及我们方案的优势在第章,我们建立并实施实验验证了我们的方案。实验结果保证了我们推论的合理性。所以在第章我们证明了我们的方案是正确和有效的。相关工作和问题的确立相关工作大数据技术已被广泛应用于电网系统。和是电网数据中心的基础设施。存储这些详细数据的主要目的是评估设备的状态,避免设备异常引起的损坏。在这种情况下,从读取数据是很常见的。然而,从读取的数据量也许很小,但大多数情况下,阅读数据的作因此,并没有个通用的数据模型,使其不仅支持连接操作,而且对多源数据也具有良好的兼容性。在本文中,我们将提出种通用的数据模型,支持操作,并具有多源数据的兼容性,从而解决上述问题。为了提高查询性能,我们进步提出了个虚拟列族机制。通过使用事件驱动型数据模型......”。
9、“.....该方法提高了从多数据源读取数据的性能。在虚拟列族机制中,我们解决了将多源数据存储到个大表中的兼容性问题。本文里,首先第章介绍了大数据的背景大数据技术的发展电网大数据的特点面临的问题和本文的主要工作论文的其余部分组织如下。第章我们对相关工作进行了调据的时间损耗可以分为两个部分查询准备时间和数据传输时间。正如我们在第节中提到的,操作不像那样支持。在这种情况下,需要由用户自己进行操作。实现操作有两种方法通过将操作集成到表中以整合所有数据到个大表中,或将每种类型的数据存储到相应的表中,这样就可以使用或编程拆分表并实现操作。如果我们传输相同数量的数据,大表和分离表的时间消耗是不同的。例如对于个分离表的通用事件驱动型数据模型论文原稿。方案分析我们从两个方面分析了我们方案的优势个方面是使用扫描操作读取数据程序,另方面是的内在存储器体系......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。