1、“.....算法算法是种极具置信力的挖掘关联规则频繁项集的算法。算法利用频繁项集属性的先验信息,采用逐步搜索的迭代策略。基于开放本体的数据关联分析研究论文原稿遗漏部分实体指称,这时要对指称列表中的待消歧命名实体的指称实行扩充。扩充后,用全称替换列表中的缩写指称,缩小消歧的范围。根据首字母缩略词和简称词的结构不同,扩充方法包括首字母缩略词扩充和简称词扩充等方法。行分类辨别以判断这个最优实体是否是正确的......”。
2、“.....则将其标注成无指代实体。在中,将无指代实体所构成的集合实行聚类。本文采用余弦相似性算法计算文本之间的相似程命名实体识别的过程。基于开放本体的数据关联分析研究论文原稿。在中,对所有候选实体集合进行排序。首先将每个待消歧命名实体指称看做个节点,提取候选实体特征,并定义成向量形式。在待消歧命名实体指称产生的候关键词开放本体数据关联分析经典算法命名实体中图分类号文献标识码文章编号介绍在信息科学领域内......”。
3、“.....明确和具体描述的形式概念。本体含结构化属性,是种异常类型的术语集,事实上是快速增长,数据关联分析显得越来越重要。为适应复杂异构数据的分析,本文基于开放本体识别互联网上文档中的各类实体,并加以标注使之具有语义,得到与主题相关的命名实体识别。随后挖掘命名實体的关联关系,丰富其中的语则,使人们在海量数据中挖的阅读更加高效快速更容易把握主题,并强化了搜索功能。般来说,命名实体识别的任务就是识别出待处理文本中大类小类......”。
4、“.....即判断个文本串是否代表个实体标注命名实体,述命名实体识别的过程。基于开放本体的数据关联分析研究论文原稿。摘要随着互联网上数据量的快速增长,数据关联分析显得越来越重要。为适应复杂异构数据的分析,本文基于开放本体识别互联网上文档中的各类实体,并加所示。关键词开放本体数据关联分析经典算法命名实体中图分类号文献标识码文章编号介绍在信息科学领域内,本体是指共享结构,明确和具体描述的形式概念。本体含结构化属性,是种异常类型的术语集......”。
5、“.....通过研究,命名实体减少了数据挖掘输入数据量的数目,结合经典算法,可以挖掘出更加感兴趣有意义的关联规则,使人们在海量数据中挖的阅读更加高效快速更容易把握主题,并强化了搜索功能。是时间表达式还是数字表达式,它们的表达形式较为致,持有恒定的规范,所以较为容易识别并标注出实体。而名称类实体具有多样性和歧义性,识别较为困难,难以消除歧义,为标注实体带来很大的阻力......”。
6、“.....产生的最优实体进行分类辨别以判断这个最优实体是否是正确的。正确则自动反馈此最优实体在知识基中相应的号若不正确,则将其标注成无指代将发现的命名实体标注为种具体的类型。其中重点是确定实体的类别以及元组的关系抽取。命名实体是网页文本中基础的信息单元,也是文本中的缩写固有名词及其它唯标识。往往划为类,即实体名称时间表达式数字表达式。无论以标注使之具有语义,得到与主题相关的命名实体识别......”。
7、“.....丰富其中的语义。通过研究,命名实体减少了数据挖掘输入数据量的数目,结合经典算法,可以挖掘出更加感兴趣有意义的关联上是种形式化的表达,基于特殊范畴之间的种说明及其互相间关系。本体般可以用来推断字段属性,也可被用来定义字段。目前,可供使用的开放本体主要有等。本文首先描绘了命名实体识别的体系框架,体。在中,将无指代实体所构成的集合实行聚类。本文采用余弦相似性算法计算文本之间的相似程度,通过向量夹角余弦值的计算来度量两个向量相似性......”。
8、“.....两向量间夹角余弦值最大为,最小为。计算公式如式基于开放本体的数据关联分析研究论文原稿名实体指称看做个节点,提取候选实体特征,并定义成向量形式。在待消歧命名实体指称产生的候选实体集合中,采用排序算法生成最优实体构成,。这里提取的特征包括表面,可能遗漏部分实体指称,这时要对指称列表中的待消歧命名实体的指称实行扩充。扩充后,用全称替换列表中的缩写指称,缩小消歧的范围。根据首字母缩略词和简称词的结构不同......”。
9、“.....基于频繁项集的全部非空子集也务必都是频繁的重要属性,采用压缩搜索空间方式,通过连接和剪枝个步骤完成。算法及与之关联过程的伪代码如下由频繁项集产生关在中,利用字符串匹配算法产生候选实体,生成指称列表中待消歧命名实体指称的候选实体。若没有产生候选实体,其待消歧命名实体指称会被标注成无指代实体。基于开放本体的数据关联分析研究论文原稿。依照频繁项集,通过向量夹角余弦值的计算来度量两个向量相似性......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。