1、“.....任意个点的密度参数即以数据集种基于信息熵和密度的算法的改进论文原稿式为基于密度的聚类算法的改进本文通过利用信息熵对欧氏距离公式进行相应的加权处理,对文献中的基于密度的聚类算法进行相应的改进,从而选取合适聚类中心应的第个数据点出现的概率。利用公式计算维属性的信息熵。所有数据点之间的平均距离其中......”。
2、“.....任意个点的密度参数即以数据集中任点为圆算法解决实际问题的过程中,会遇到数据的属性值种类多且重要性不致的问题,而基于密度的聚类算法并不能很好处理这种缺点,因此,需将信息熵的概念引入到基于密度改进的利用加权的欧式距离公式计算出数据集中的数据点与个聚类中心的距离,根据类内距离最小化的原则将其聚类到不同的簇中。用公式重新计算这个聚类簇的聚类中心......”。
3、“.....而且利用的欧氏距离公式对待每个属性的重要性是致的,导致聚类中心选择有问题,聚类精度不精确。在集合中找出密度参数值为的所有数据点,利用公式离公式将剩余数据划分到距离最近的聚类中心的簇中。这个聚类划分的过程需要反复迭代,直到新选出的聚类中心与上次的差距不大为止。其算法的具体过程如图所示。聚类算法对数据集进行相应的聚类......”。
4、“.....基于信息熵和密度的聚类算法聚类结果更精确。关键词信息熵加权欧氏距离基于信息熵和密度的聚类算法中图分类号删除。其中,。重復步骤,直到选出个聚类中心。种基于信息熵和密度的算法的改进论文原稿。摘要影响聚类算法的因素主要有聚类个数初始聚类中心异种基于信息熵和密度的算法的改进论文原稿算出最小的,此时最小的所对应的数据点即为聚类中心......”。
5、“.....其中,。重復步骤,直到选出个聚类中心。聚类结果数据集中会出现所谓的噪声和孤立点数据,而这些数据在聚类的过程中会对聚类中心产生影响,从而形成局部最优解。当数据集中的数据属性维度较大时,不仅会产生冗余信息从而使计算这个聚类簇的聚类中心,并对数据集进行重新划分,直到满足误差平方和公式收敛为止。其中,代表的是聚类中心......”。
6、“.....代表的是聚类簇中的数据点的个数,。尽管具备计算复杂度简单可扩展性好收敛速度快和效率高大优点,但也有缺点。它的缺点主要包括由于聚类数目是人为决定的且聚类中心是随机选择,因此不同的聚类中心和聚类数目会导致不献标识码文章编号引言聚类算法是在年由提出的种基于欧氏距离和误差平方和函数的划分聚类算法。它的主要目的是通过选取聚类中心和聚类个数......”。
7、“.....本文通过利用信息熵确定属性的权重,从而对欧氏距离进行加权处理,将孤立点从数据集中取出,从而更好得选出聚类中心,然后利用加权欧氏距离公式在集合中找出密度参数值为的所有数据点,利用公式计算出最小的,此时最小的所对应的数据点即为聚类中心......”。
8、“.....利用加权的欧式距离公式计算出数据集中的数据点与个聚类中心的距离,根据类内距离最小化的原则将其聚类到不同的簇中。用公式重基于密度的聚类算法并不能很好处理这种缺点,因此,需将信息熵的概念引入到基于密度改进的聚类算法中,从而客观的确定属性的权重,对欧式距离公式进行相应中任点为圆心,平均距离为半径......”。
9、“.....其中,当时,当时,。所有数据点密度的平均值孤立点的确定信息熵其中,为出现的概率。种基于信息进行相应聚类。具体的实现过程如下从包含有个属性值的个数据集合中,利用公式计算出所有数据点之间的距离平均距离密度及平均密度。利用公式将数据集划分成孤立点集合和剩,平均距离为半径,圆内数据的个数即为的密度参数。其中,当时,当时,......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。