1、“.....如果目标群体是有意义的,那么集群应该捕获数据的自然结构。但是在些情况下,聚类分析只是个用于其他目的有用的起点,如数据汇总。无论是理解或效用,聚类分析,长久以来在各个领域扮演重要角色心理学等社会科学,生物学,统计,模式识别,信息检索,机器学习和数据采集。聚类分析已经被应用到许多实际问题中。我们按照聚类的目的是了解或者实用而提供了些具体的例子。聚类理解类。对象或概念上是有意义的群体,有着共同的特点,在人们如何分析和说明事物上有重要的作用。事实上,人类善于将对象和特定对象分成组集群并且将它们分类。例如,即使是相对较小的儿童也可以快速识别出照片中的建筑物,车辆,人物,动物,植物等拍摄对象。在数据理解方面方面......”。
2、“.....而聚类分析就是自动将集群分类的技术。以下是些例子•生物学。生物学家们花了很多年创造了万物分类分层分类领域语系类秩序科属和种。因此,这也许并不奇怪,在群集分析的早期多是试图建立个数学学科分类,可以自动找到这样的分类结构。最近,生物学家已经将聚类应用到遗传信息处理放面。例如,集群已被用于寻找具有类似的功能基因组。•信息检索。万维网有数十亿的网页,个搜索引擎的查询结果可以北京交通大学毕业设计论文第页返回数千页。集群可以用来将这些搜索结果归为具有相同点的大类。例如,个电影的查询可能会返回到诸如评论,预告片,明星和剧院类别分组的网页。每个类别集群可以分成子类别子集,产生个层次结构,进步帮助用户在查询结果。•气候......”。
3、“.....为此,聚类分析已被应用到寻找到对陆地上气候有重大影响的极地地区和海洋地区的大气压力。•心理学和医学。疾病或健康有很多的变数,聚类分析可以用来识别这些不同的子类别。例如,集群已被用于识别不同类型的抑郁症。聚类分析也可用于检测种疾病空间和时间分布格局。•业务。企业收集当前和潜在客户大量信息。集群可以用来把客户分组以便进行额外的分析和营销活动。聚类效用聚类分析提供了条从单个数据对象抽象到集群中。此外,些集群技术根据定的规则描述各集群的特点,也就是说,个数据对象,它是在集群中的其他对象的代表。这些集束原型可以用来作为分析的数据或数据处理些技术基础。因此,在公用事业方面,聚类分析是寻找最有代表性的集群原型研究方法......”。
4、“.....许多数据分析技术,如回归或,都为或更高其中是物体的数量,因此,不适合大数据集。然而,虽然算法不适用于整个数据集,它可以应用到减少簇原型组成的数据集。依据分许多类型的数据,该原型可以被看作是最核心的点,在这种情况下,我们通常所说的中心的集群原型为基础的集群。毫不奇怪,这种集群往往是球状。图显示了个中心为基础的集群的例子。基于图的数据是,如果作为个图,其中的节点对象和对象之间的联系表示连接参见第节,然后组可以作为个连接组件中定义的代表,也就是说,对象的组彼此相连,但不会对本集团以外对象的连接。种基于图的集群重要的例子是连续性的群集,其中只有两个对象,如果它们连接在个相互指定距离之内。这意味着......”。
5、“.....图给出了两维点,如簇的例子。这群集的定义是有用的当集群不规则或交织在起,但可以有麻烦时,噪音存在,因为由两个图项的积分可北京交通大学毕业设计论文第页以合并两个不同的簇群小桥球形说明。的图形为基础的集群其他类型也是可能的。其中种办法第定义为个集团群集,也就是说,组节点在个完全相互连接图。特别是,如果我们加入了对象之间的距离为彼此连接,形成个群集,当个对象的形式设置个集团。像原型为基础的集群,这种集群往往是球状。基于密度的群集是组环绕低密度区域对象的密集区。图显示定密度的数据为基础,加入噪声的数据图三创建群集。集群的两个圆形不合并,如图项,因为它们之间的桥梁进入噪音消失。同样地,存在的曲线图又消失的噪音之中......”。
6、“.....集群的个基于密度的定义时,往往采用集群不规则或交织,在噪声和离群点都存在。相比之下,集群的个连续性的定义都不能很好的工作数据,图由于噪声往往会形成集群之间的桥梁。共享属性概念集群更普遍,我们可以定义为个共享对象的些属性设置群集。这个定义包括所有以前的群集的定义,在个中心的群集共享,例如,对象的属性,它们都是相同的质心。然而,共享属性的方法还包括集群研究的新类型。考虑图所示的群集五。个三角区集群毗邻长方形之,有两个交织在起的圆圈集群。在这两种情况下,聚类算法将需要集群的个非常具体的概念,成功地检测到这些集群。对查找安泰这种集群的过程称为概念聚类。然而,过于复杂的集群的个概念,会考虑在模式识别领域的我们......”。
7、“.....北京交通大学毕业设计论文第页路线图在这章中,我们使用以下三个简单的,但聚类分析所涉及的许多重要概念。•算法这是个以原型为基础,试图找到个均值的聚类技术。•凝聚层次聚类此分群方式是指组密切相关的聚类技术,开始时各自作为个单身聚点,然后反复,直到个单的合并两个最接近的集群的层次聚类集合,全方位的集群仍然存在。这些方法在些有基于图形的聚类方面自然解释,而其他人在个原型为基础的方法方面作出解释。•这是个基于密度的聚类算法,划分聚类,在其中的簇数量为自动,由算法确定。但低密度区的点容易被忽略,因此不是种完整的聚类方法。类型原型的数量准确度的不同,结果可以媲美那些将已获得的所有数据。•压缩。集群原型也可用于数据压缩......”。
8、“.....个表被创建为每个集群的原型组成,也就是说,每个原型分配个整数值,是其在表中的位置索引。每个对象的代表是与其相关的原型群集索引。这种压缩类型被称为矢量量化,并经常用于图像,声音和视频数据,其中数据对象很多北京交通大学毕业设计论文第页都是彼此非常相似,些信息丢失是可以接受的,数据规模大幅减少是理想•有效发现最近邻居。最近的邻居发现可以要求计算所有点之间的成对的距离。通常集群与集群原型可以更有效的找到。如果对象比较接近其集群原型,然后我们可以使用原型,以减少其寻找对象的近邻距离计算数量。直观上,如果两个集群原型是相距甚远,那么在相应的簇对象不会是邻居。因此,要找到个对象的近邻,只需要计算距离。本章提供了个聚类分析的介绍......”。
9、“.....包括各种的分为簇集对象和不同类型的集群的分类方法。然后,我们描述了三个具体的聚类算法技术,代表了两大类,并说明个概念品种有均值,凝聚层次聚类,算法。本章最后节是专门聚类有效性,评估方法由个聚类算法产生的集群善良。更先进的集群概念和算法将在第章讨论。,我们尽可能的讨论了不同方案的长处和弱点。此外,书目说明提供参考相关的书籍和论文,更深入的探讨聚类分析。概述在具体讨论什么事聚类技术时,我们提供些必要的背景。首先,我们进步确定聚类分析,说明和解释其难点以及和其他集群方法的关系。然后探索两个重要议题将不同的事物组合成类,类型的集群。什么是聚类分析聚类分析组数据对象仅仅基于环境中,描述对象和它们之间的关系。我们的目标是......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。