1、“.....导致流式数据聚类算法的运行效率受到定的影响,如何提高流式数据聚类的效率尤其是针对高维数据尤为重要。基于的高维流式数据聚类算法论文原稿。年由提出的基于网格密度的算法,处理的是个个网格,而非个个数据,所以算法具有定的速度优势。但是在网格划分时,存在高维网格划分需基于的高维流式数据聚类算法论文原稿数据稀疏问题作出分析。在有限的计算资源下,提高高维流式数据聚类算法的效率具有定的研究意义。关键词流式数据滑动窗口聚类引言近年来,我们处在个数据爆炸式增长的时代,从以往的静态数据过渡到流式数据,其隐藏在这些数据背后的商业价值是不可估量的。如今,在有限的计算能力下处理流式数据处处受限......”。
2、“.....如何提高流计算量,提高了聚类的效率,而且在算法的处理上有着定的好处,可以保证聚类的质量。年由提出的基于网格密度的算法,处理的是个个网格,而非个个数据,所以算法具有定的速度优势。但是在网格划分时,存在高维网格划分需要计算消耗,所以影响算法的运行效率。近年来,对于网格密度的算法也有着大量的研究,例如孙玉芬针对高维数据问题数据将数据输入到后续的处理算法中新数据点加入新数据加入以及网格更新。基于的高维流式数据聚类算法的实现本文采用的是滑动窗口与结合的思想对其进行降维处理,然后再对滑动窗口中处理后的数据进行摘要的提取,网格的划分,在时间间隔后,离线过程根据网格的密度以及些判断条件对网格进行处理,包括更新网格密度删除零星网格等......”。
3、“.....形成个个的簇,并且在离线过程对簇进行调整这是由流式数据特点决定的。数据流式具有快速的大量的持续不断产生的特点,所以本文分析并使用滑动窗口技术与算法相结合来适应流式數据的处理。其中,采用定滑动窗口模式,为滑动窗口定个值,并采用周期法,数据流流入时,且数据片段未达到窗口大小时,暂时将数据存储在缓存区内,当满足滑动窗口要求时将数据放入滑动窗口内,对数据进行降维处理。当数据开始流入数据聚类算法,在定程度上可以处理高维流式数据,在对高维数据存在的数据稀疏的问题上具有定的去噪能力,由实验结果表明本文提出的基于的高维流式数据聚类算法较算法在聚类精度上有定的提高。总结本文提出的基于的高维流式数据聚类算法是基于算法的基础上进行改进,该算法能有效的处理高维数据......”。
4、“.....设来表示算法运行效率的对比度,如图所示。从图的运行结果可以看出,本文提出的基于的高维流式数据聚类算法明显的比算法在聚类效率上有所提高。本文提出的算法具有明显的优势,首先,该算法采用了滑动窗口技术,使得处理的数据可以分批次批量处理其次,从直接处理高维数据,变成处理极大保留了原始数据完整性的低维数据,使得网流入的数据是否达到滑动窗口的大小,若是没有则继续流入数据,当达到滑动窗口大小时,使用降维处理窗口内的数据。当选取了尽可能优的低维空间,得到了降维后的数据集,对降维后的数据再进行极差标准化处理,然后再进行数据的摘要提取和网格划分。实验数据集采用的是网络入侵检测数据集。实验使用数据集模拟数据流进行输入......”。
5、“.....设滑动窗口大小为,然后判断流入的数据是否达到滑动窗口的大小,若是没有则继续流入数据,当达到滑动窗口大小时,使用降维处理窗口内的数据。当选取了尽可能优的低维空间,得到了降维后的数据集,对降维后的数据再进行极差标准化处理,然后再进行数据的摘要提取和网格划分。基于的高维流式数据聚类算法论文原稿。,孙玉芬,基于网格方法的聚类算法研究华中科技大学,于翔,印桂生,许宪东等种基于区域划分的数据流子空间聚类方法計算机研究与发展,刘波,王红军,成聪等,基于属性最大间隔的子空间聚类南京大学学报,肖红光,陈颖慧,巫小蓉,基于结构树的高维数据流子空间自适应聚类算法小型微型计算机系统,......”。
6、“.....符合流式数据处理的条件,并且在降低高维数据的难题下,算法又可以很大程度上的保留原始数据的完整性,并且在降维的过程中又可以在定程度,上消除数据的高维稀疏特性,不仅降低了数据处理的计算量,提高了聚类的效率,而且在算法的处理上有着定的好处,可以保证聚类的质量。但是主成分分析并不能直接处理流式数据,这是由流式数据特点决定的。数据流式形状分布的簇,实验结果表明该算法的可行性,不仅提高了效率,而且在定程度上解决高维稀疏的特性,提高聚类准确率。对于未来的研究,将放在进步提高算法的效率与准确率上,自适应算法的加入是下步研究重点。参考文献划分产生的计算量大大的降低,从而使得算法的运行效率得到大大的提高。针对高维数据的高维稀疏性的特点,实验之前......”。
7、“.....发现该数据集不仅存在高维特性,而且出现数据稀疏的特点,所以又做了本论文提出的基于的高维流式数据聚类算法与算法的准确率对比,实验结果图如图。由上述实验的数据结果得出,本论文提出的基于的高维流式大小设置为万。从原理上来分析,基于的高维流式数据聚类算法降低了数据的特征维度,并且定程度上解决了数据高维稀疏的特点,所以大大的减少了网格划分时所产生的计算量,从而改善了算法的运行效率,图即为本文提出的算法与算法在网络入侵数据集上的运行效率对比图,其中代表降维的时间,表示降维后数据聚类的时间,表示原始有快速的大量的持续不断产生的特点,所以本文分析并使用滑动窗口技术与算法相结合来适应流式數据的处理。其中,采用定滑动窗口模式,为滑动窗口定个值,并采用周期法......”。
8、“.....且数据片段未达到窗口大小时,暂时将数据存储在缓存区内,当满足滑动窗口要求时将数据放入滑动窗口内,对数据进行降维处理。当数据开始流入算法时,设滑动窗口大小为,然后判断基于的高维流式数据聚类算法论文原稿新数据点加入新数据加入以及网格更新。上述步骤是基于的高维流式数据聚类算法的简要处理过程,算法采用的滑动窗口技术与降维算法相结分,在时间间隔后,离线过程根据网格的密度以及些判断条件对网格进行处理,包括更新网格密度删除零星网格等,最后再根据算法对网格进行密度聚类,形成个个的簇,并且在离线过程对簇进行调整,包括簇的合并簇的分裂等。其中的主要的过程如下输入数据流网格密度系数入时间参数网格划分输出聚类簇计算消耗,所以影响算法的运行效率。近年来......”。
9、“.....例如孙玉芬针对高维数据问题提出的基于聚类子空间的算法于翔等人提出的数据子空间的算法刘波等人提出的属性最大间隔的子空间聚类算法肖红光等人于年提出的基于结构树的高维流式数据子空间的自适应聚类算法等。针对以上众多算法研究发现,针对高维数据流的算数据聚类的效率尤其是针对高维数据尤为重要。基于的高维流式数据聚类算法论文原稿。其中,主成分分析法可以最大程度的保留原始数据的信息,所以可以提供足够的的信息来综合反映原始数据。关键词流式数据滑动窗口聚类引言近年来,我们处在个数据爆炸式增长的时代,从以往的静态数据过渡到流式数据,其隐藏在这些数据背后的商业价值是不可估量的。如今......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。