1、以下这些语句存在若干问题,包括语法错误、标点使用不当、语句不通畅及信息不完整——“.....但由于没有针对异常检测的特别优化,效果时好时坏,不同应用场景差别很大。基于聚类的异常检测算法的局限表现在数据集依赖性,主要是对于内部数据密度差异太大的数据集,常误将稀疏区域判断为异常状态。此外,其他常见的时间序列的异常检测算法主要有基于概率分布的方法和基于检索深度的方法等。时间序列相似性度量研究现状时间序列的相似性度量是时间序列分析和挖掘任务的基础。目前......”。
2、以下这些语句存在多处问题,具体涉及到语法误用、标点符号运用不当、句子表达不流畅以及信息表述不全面——“.....对于传统数据类型来说,相似性度量是精确度量,而对于时间序列来说,由于它的数值性和连续性,相似性度量是种近似度量。对于时间序列挖掘来说,种合适的相似性度量函数是非常重要的。相似性度量可分为两种种是全序列匹配,在相似性查询的过程中,使用整条查询序列的所有数据与其他候选序列进行相似性匹配种是子序列匹配,在相似性查询过程中,在被查询序列中需找与查询序列相似的子序列。全序列匹配和子序列匹配都需要计算相对应的序列之间的相似度,只是子序列匹配还需要增加对被查询序列的分段过程。等人提出时间序列的相似性度量的概念后,等最早提出基于欧氏距离的度量,因为该度量严格匹配序列中对应的数据点,平滑性不够,其存在着对噪声十分敏感的问题,从而使得聚类的效果很差。之后文献通过在欧氏距离上增加权重在定程度上具有了消除变换偏移量控制缩放幅度比例等优点......”。
3、以下这些语句在语言表达上出现了多方面的问题,包括语法错误、标点符号使用不规范、句子结构不够流畅,以及内容阐述不够详尽和全面——“.....可操作性较差,对大数据量的相似性度量效果极差。和将动态时间弯曲距离引入到时间序列相似性度量当中,在相似性度量时根据实际情况对时间轴进行移动,在两条时间序列之间寻找条对齐路径,使得两条序列之间的距离最小,从而得出更准确的度量结果。但该算法的时间代价太高,另外,算法不能发现两条时间序列特征点之间的对应关系,其准确度不高。些学者,通过引入索引技术改进了,李海林等提出了分段时间弯曲距离,等提出了种引入四元数的动态时间弯曲距离,通过引入更多的参数,使得算法的适应性更强。所有这些改进使度量算法的时间复杂度有所降低,进而缩短了聚类时间。万方数据绪论于年将最长公共子序列度量应用于时间序列的相似性度量中。最长公共子串的基本思想是通过两个字符串之间最长公共子串的长度来衡量字符串之间的相似性程度,这方法在语音识别和文本匹配领域中得到广泛研究与应用。等在其基础上提出......”。
4、以下这些语句该文档存在较明显的语言表达瑕疵,包括语法错误、标点符号使用不规范,句子结构不够顺畅,以及信息传达不充分,需要综合性的修订与完善——“.....对于不等长序列的相似距离求解也有较好表现。另有些研究人员提出了基于斜率的基于模型的基于事件和基于形态的相似度测量。时间序列聚类现状聚类是人类项最基本的认识活动,是数据挖掘的项重要的方法。聚类分析是面对组未知分布的数据,利用数据对象间的关系信息,将事物聚集成类,使各类间的相似性尽可能小,类内相似性尽可能大,这个过程实际上是种在非监督状态下寻找最优划分的过程。时间序列的聚类分析就是将普通聚类分析的数据对象替换为时间序列,最后结果力求类内相似性小,而类间相似性大。按照时间序列集合粒度的不同,可以划分为全序列聚类子序列聚类和时间点聚类。时间序列聚类有着重要的实际应用意义,近年来得到了大家普遍的重视,目前已经有大量深入而广泛的研究。有些学者,最初将分层聚类应用与时间序列聚类,取得了定的效果,但应用于具体应用领域效果不佳。黄超对金融时间序列提出了基于多重分形的时序聚类......”。
5、以下这些语句存在多种问题,包括语法错误、不规范的标点符号使用、句子结构不够清晰流畅,以及信息传达不够完整详尽——“.....经典的均值聚类模糊均值聚类对被引入时序聚类,聚类预测更符合实际的时间序列模型。涉及到时间序列粒度划分问题,同条时间序列在整个统计时段内可能隶属于不同的类,其动态性是必须考虑的因素,为此等提出了考虑自相关时序的模糊聚类算法。日本学者随后针对聚类和滑动窗口深入分析后,发现子序列聚类总是与实际状态不符,验证后提出种基于移动平均值的子序列聚类算法来修正出现的正弦模型缺陷。文献研究了通过主成分分析法对时间序列进行处理,达到了降维并且聚类的目的。等系列研究人员提出了基于隐马尔科夫模型的时间序列聚类分析,之后结合期望最大化方法,提高了算法整体的准确性。对于低质量的时间序列,即存在较多异常数据的情况,对序列根据平均数转二元序列后聚类,成功减少了异常数据的影响。近年来随着研究的深入,学科交叉的广泛推进,时间序列聚类算法有了些更新的进展。等将粒子群优化算法同算法相结合,针对局部最优解优化......”。
6、以下这些语句存在多方面的问题亟需改进,具体而言:标点符号运用不当,句子结构条理性不足导致流畅度欠佳,存在语法误用情况,且在内容表述上缺乏完整性。——“.....但收敛速度较慢,有效地降低了算法陷万方数据硕士学位论文入局部最优的概率,提高了收敛速度和聚类准确率。文献针对聚类类数确定的难题,采用偏向参数空间的自适应算法,搜索解空间,确定最优聚类个数,取得最优聚类结果。建立在图论基础上的谱聚类,文献提出了种监督信息特性的主动学习策略,借助图论算法基础,为谱聚类算法的性能优化提供了全新思路。算法通过图遍历确定各类内和类间的距离监督信息,构筑半监督主动谱聚类综合模型,性能比随机选取谱聚类中心的算法更好。等重新涉及约束信息的数据结构,成对的约束信息降维速度提高很多,同时聚类过程的距离度量因为更多的数据条带粘性,结果在很多情况下优于继续线性结构的球形聚类算法。等利用类似于支持向量机的非参数方法学习距离函数进行聚类,能有效地处理高维数据。本文主要内容研究内容本文将主要围绕时间序列相似性度量算法以及其在矿井提升机故障诊断应用展开......”。
7、以下这些语句存在标点错误、句法不清、语法失误和内容缺失等问题,需改进——“.....当前,欧氏距离与动态弯曲距离是两种常用的距离函数,由于欧氏距离不能支持时间序列数据的现行漂移,即要求时间序列等长性而动态弯曲距离算法的时间复杂度较大,对与较长的时间序列,度量效果很差。本文在最长公共子序列算法的基础上提出种针对符号化时间序列振幅平移时间轴伸缩和弯曲等情况有较好表现的相似性度量。基于增强的最长公共子序列模型的相似性度量聚类实现将本文提出的改进的时间序列相似性度量,应用于时间序列数据的相似性聚类当中,结合常用聚类模型思想,提出种基于增强的最长公共子序列模型的时间序列聚类模型。而后通过序列集的分布特征对聚类结果进行评价,依据类标签同标准数据集固有量值和特征量值的匹配度,对算法进行评价。在矿井提升机故障诊断中的应用利用矿井提升机系统的关键设备减速器的振动数据集,对其进行分段筛选......”。
8、以下文段存在较多缺陷,具体而言:语法误用情况较多,标点符号使用不规范,影响文本断句理解;句子结构与表达缺乏流畅性,阅读体验受影响——“.....建立标准的经过归化处理的振动时间序列样本库,应用基于增强的最长公共子序列聚类模型进行故障诊断。结合常用故障检测模型,评价该聚类模型在故障诊断过程中的有效性。万方数据绪论文章结构论文分为五章,具体安排如下第章为绪论,主要介绍论文的研究背景,当前时间序列数据挖掘在矿井提升机系统故障诊断邻域中的应用与局限性,阐述了论文的意义和目的,对当前相关领域的研究现状进行总结,并给出论文的主要工作内容和结构安排。第二章为时间序列相似性度量的分析,主要对基础概念和相关理论进行梳理,对主要时间序列相似性度量算法进行了概述和比较,针对其不足提出了算法,并通过实验对算法的有效性和可行性进行验证。第三章提出了种基于相似性度量的聚类算法,阐述了算法的基本思想,依据实验数据集和聚类结果的统计特征对聚类结果进行评估,对于算法中关键参数的选择进行了分析。第四章对提升机系统故障进行分析,选取减速器振动数据......”。
9、以下这些语句存在多方面瑕疵,具体表现在:语法结构错误频现,标点符号运用失当,句子表达欠流畅,以及信息阐述不够周全,影响了整体的可读性和准确性——“.....将本文提出的聚类算法应用于矿井提升机故障诊断应用中,实验测试并进行分析。第五章对全文进行了总结,并展望下步的研究方向。本章小结在参考了大量文献后,总结了矿井提升机系统故障诊断技术动态,以及时间序列相似性度量时间序列聚类在国内外的研究现状。分析了数据挖掘技术应用与我国矿井提升机故障诊断系统的紧迫性以及国家行业对该类研究的重视。最后给出了本文的研究内容和文章结构等。万方数据硕士学位论文矿井提升机故障时间序列符号化聚类方法研究作者李志刚导师牛强副教授中国矿业大学二〇四年六月万方数据中图分类号学校代码密级公开中国矿业大学硕士学位论文矿井提升机故障时间序列符号化聚类方法研究作者李志刚导师牛强申请学位工学硕士培养单位计算机科学与技术学院学科专业计算机应用技术研究方向数据挖掘答辩委员会主席丁世飞评阅人二〇四年六月万方数据学位论文使用授权声明本人完全了解中国矿业大学有关保留使用学位论文的规定......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。