帮帮文库

返回

K-means算法研究综述(论文原稿) K-means算法研究综述(论文原稿)

格式:word 上传:2022-08-17 03:38:11

《K-means算法研究综述(论文原稿)》修改意见稿

1、“.....本文则从以上几个方面对算法的研究进展进行综述。本文第部分介绍传统的算法,第部分部最优解。是对离群点敏感,聚类结果易产生误差。是相似性度量的函数不同也会对聚类结果产生影响。本文针对的缺陷,对这几年算法的研究进展进行了综述。从初始中心点的选取离群点的检测与去除相似性度量等几个方面进行概括比较最后,对算法的未来趋势进行展望。关键词算法初始算法研究综述论文原稿上可以在定的时间内找到最优解或近似最优解。通常是使用这些算法来寻找算法的初始聚类中心。等人的实验结果显示,和遗传算法结合的算法优于算法。遗传算法就是把每个聚类中心坐标当成染色体基因。聚类中心个数就是染色体长度......”

2、“.....理论分析和实验表明,该算法不但可以防止空类出现,而且同时还具有非常好的全局收敛性和局部寻优能力,并且在孤立点问题的处理上也具有很好的效果。陈小雪等人提出了种基于萤火虫优化的加权算法。该算法在提升聚类性能的同时,有效增强了算法的收敛速度。在实验阶段,通过的聚类中心,直到类簇不再发生变化。这个方法不足之处是当数据集比较大时,花费时间会比较长。等人首先是采用最大最小准则算法初步确定初始聚类中心,然后通过将聚类中心偏移到尽可能地靠近实际的聚类中心。最大最小准则算法是首先随机选取个点作为第个聚类中心,选取距离这个点最远的点作为第个聚类中心,然后计算每等人采用减法聚类的算法确定初始聚类中心......”

3、“.....选取山峰函数值最大的点作为聚类中心。选取下个聚类中心时要消除已经确定的聚类中心的影响,就修改山峰函数,减去上个确定的聚类中心的比例高斯函数,如此反复,直到得到足够多的聚类中心。这个方法的缺点在于对于离群点异常值抗干扰能力心算法,容易陷入局部最优解。贾瑞玉等人主要运用了等人提出的类簇中心都处在局部密度比较大的位置,且距离具有比它更大的局部密度的对象相对较远的思想。运用此思想可以确定最佳初始聚类中心及数据集的最佳类簇数目。贾瑞玉等人在这个思想的基础上,为了避免密度对截断距离的依赖性,重新定义了计算样本局为了避免密度对截断距离的依赖性,重新定义了计算样本局部密度的方法,计算样本点到具有比它更高的局部密度数据对象的最近距离......”

4、“.....运用统计学中残差分析的方法,选取残差绝对值大于阈值的异常点,即为聚类中心。在维以及高维数据集上的实验结果均验证了该算法的有效性。但是不足之处在于这个算推,直到最大最小距离不大于,。是个在高维空间中快速搜索个最近邻居的库。使用找到聚类中心的近邻,计算中心点即为新的聚类中心。重复和,直到聚类中心不再发生变化。算法的改进初始聚类中心的选取初始聚类中心的选取对算法聚类结果的影响很大,不同的初始聚类中心,可义的属性。然后将将属性的值按照顺序排列,以分成两类为例,将数据集的上分位点和下分位点作为初始聚类中心,计算所有样本点到到这两个聚类中心的距离,进行分类接下来更新聚类中心,将每类所有样本点的均值作为新的聚类中心,直到类簇不再发生变化......”

5、“.....花费时间会比较长。等人首先是采用最大算法研究综述论文原稿密度的方法,计算样本点到具有比它更高的局部密度数据对象的最近距离。根据和构造决策图,运用统计学中残差分析的方法,选取残差绝对值大于阈值的异常点,即为聚类中心。在维以及高维数据集上的实验结果均验证了该算法的有效性。但是不足之处在于这个算法适用于比较集中的数据集,稀疏的数据集结果并不理想。近区域的密度和它的邻居的局部密度的比值。方法依赖于用户提供的最小数量点,用于确定邻居的大小。重复和,直到聚类中心不再发生变化。算法的改进初始聚类中心的选取初始聚类中心的选取对算法聚类结果的影响很大,不同的初始聚类中心,可能会产生不同的聚类结果。也可以说,算法是种优化的加权算法......”

6、“.....有效增强了算法的收敛速度。在实验阶段,通过数据集中的几组数据对该算法进行了聚类实验及有效性测试,实验结果充分表明了该算法的有效性及优越性。等人采用减法聚类的算法确定初始聚类中心。首先是计算每个样本點的山峰函数值,选取山峰函数值最大的适用于比较集中的数据集,稀疏的数据集结果并不理想。算法研究综述论文原稿。离群点的检测算法对于离群点敏感,对聚类结果产生很大的影响,因此离群点的检测与删除极为重要。等人的基于密度的方法是种流行的异常值检测方法。它计算每个点的局部离群因子。个点的是基于该点附会产生不同的聚类结果。也可以说,算法是种贪心算法,容易陷入局部最优解。贾瑞玉等人主要运用了等人提出的类簇中心都处在局部密度比较大的位置......”

7、“.....运用此思想可以确定最佳初始聚类中心及数据集的最佳类簇数目。贾瑞玉等人在这个思想的基础上小准则算法初步确定初始聚类中心,然后通过将聚类中心偏移到尽可能地靠近实际的聚类中心。最大最小准则算法是首先随机选取个点作为第个聚类中心,选取距离这个点最远的点作为第个聚类中心,然后计算每个点到这两个聚类中心的距离,选取较小的距离加入到集合中,在集合中选取距离最远的点作为下个聚类中心,依次类点作为聚类中心。选取下个聚类中心时要消除已经确定的聚类中心的影响,就修改山峰函数,减去上个确定的聚类中心的比例高斯函数,如此反复,直到得到足够多的聚类中心。这个方法的缺点在于对于离群点异常值抗干扰能力比较弱......”

8、“.....等人采用了分位数的概念来确定初始聚类中心。首先采用特征选择的方法选取数据有算法研究综述论文原稿各中心点坐标。算法研究综述论文原稿。沈艳等人将粒子群算法与算法结合,提出多子群多于多子群粒子群伪均值聚类算法,理论分析和实验表明,该算法不但可以防止空类出现,而且同时还具有非常好的全局收敛性和局部寻优能力,并且在孤立点问题的处理上也具有很好的效果。陈小雪等人提出了种基于萤火从各个方面介绍算法的优化,第部分进行总结以及展望。算法的其他改进最近几年出现了遗传算法粒子群算法萤火虫算法蚁群算法等与传统的算法相结合的改进算法,这几类算法的共同点是具有定的全局优化能力,理论上可以在定的时间内找到最优解或近似最优解......”

9、“.....聚类算法被提出来后,经过多年的实践证明,算法依然是简单高效的算法,并且被广泛应用在科学研究以及工业应用中,发展出大量的改进的算成个种群进行遗传操作,最终获得适应度最大染色体,而最优聚类中心坐标就是解析出的各中心点坐标。摘要算法是种非常简单并且使用广泛的聚类算法,但是是值需要预先给定,很多情况下值的佑计很困难。是算法对初始选取的聚类中心点很敏感,不同的中心点聚类结果有很大的不同。也就是说,有可能陷入局数据集中的几组数据对该算法进行了聚类实验及有效性测试,实验结果充分表明了该算法的有效性及优越性。算法研究综述论文原稿......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
K-means算法研究综述(论文原稿).doc预览图(1)
1 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(2)
2 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(3)
3 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(4)
4 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(5)
5 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(6)
6 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(7)
7 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(8)
8 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(9)
9 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(10)
10 页 / 共 11
K-means算法研究综述(论文原稿).doc预览图(11)
11 页 / 共 11
预览结束,喜欢就下载吧!
  • 内容预览结束,喜欢就下载吧!
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档