基于Fp—Tree频繁模式的挖掘算法（论文原稿）

格式：word 上传：2022-08-17 03:10:20

《基于Fp—Tree频繁模式的挖掘算法（论文原稿）》修改意见稿

1、“.....将和他的频繁子集连接生成频繁项集。关联规则是对事物之间相互依存和关联关系的种描述。挖掘频繁模式是挖掘关联规则的基础，针对这种模式的挖掘有系列优秀算法，比如算法和算法。其中算法思路直观，更易实现，但需多次扫描数据集并产生大量候选频繁项集。相对的，在挖掘过程中无需产生候选集，与相比效率更高。但是，传统的基于频繁模式的挖掘算法论文原稿范明，李川在樹中挖掘频繁模式而不产生条件树计算机研究与发展，作者单位长治学院计算机系山西的算法挖掘频繁集，记下其运行时间，如图所示图算法运行时间从图中可以看出，在数据量较小的情况下，两种算法花费的时间几乎相等......”。

2、“.....改进的算法所花费时间明显小于传统方法，效率有了定的提高。参考文献范明，孟小峰等译数据挖掘概念与技术北京机械工业出版社，和他的频繁子集连接生成频繁项集与频繁前缀组合得到频繁项集，。将步中得到的频繁项集组合并更新其支持度，得到新的频繁项集，。继续后根遍历，得到非叶子结点，其频繁子孙集，频繁前缀为。者连接得到频繁项集，与频繁前缀组合得到频繁集。结束条件条件为空则退出如果新的只有条单的路径到叶子结点，则输出该路径上所有结点的组合，并上中的频繁项即为频繁项集。传统算法存在的问题首先，传统的算法需要使用递归机制去插入频繁项以形成......”。

3、“.....过程将会被递归调用。根据递归函数调用栈的原理可知，在递归结束结点具有相同的项目名称，方法将的计数加。否则，创建新的子结点，并将其计数置为，然后，将结点链接到其父结点，同时，再将链接到到具有相同项名的结点上。若不为空，方法会递归地调用。扫描所有的交易后，颗完整的被构建出来。挖掘以获得频繁项集合。挖掘过程需要在中建立好的原始结构建立条件，条件的构建方式与原始构建方式相同。条件模式基是指从根节点出发到所有以该项为最后项的前缀路径上结点的集合。条件模式基的计数为路径中结点的最小计数。接着，我们再次扫描数据集......”。

4、“.....每次添加笔事务的频繁项之前，先对这些事务进行预处理将其中的非频繁项删除，剩余项按照中的顺序未包含的项目，对剩余项目按照中的顺序进行排序，记作，其中表示排序后序列的第项，表示剩余项。调用方法将交易的频繁项插入到中。若有个子结点满足条件，也即两个结点具有相同的项目名称，方法将的计数加。否则，创建新的子结点，并将其计数置为，然后，将结点链接到其父结点，同时，再将链接到到具原稿。结束条件条件为空则退出如果新的只有条单的路径到叶子结点，则输出该路径上所有结点的组合，并上中的频繁项即为频繁项集。传统算法存在的问题首先......”。

5、“.....只要剩余项列表仍是非空集，过程将会被递归调用。根据递归函数调用栈的原理可知，在基于频繁模式的挖掘算法论文原稿中递归挖掘以得到频繁项集，在此过程中还需生成很多条件，具体步骤如下逆序遍历频繁项列表，对每项找出其条件模式基，以条件模式基的集合作为新的交易集建立条件，条件的构建方式与原始构建方式相同。条件模式基是指从根节点出发到所有以该项为最后项的前缀路径上结点的集合。条件模式基的计数为路径中结点的最小计数。定程度上提高了算法效率。基于频繁模式的挖掘算法论文原稿。建立。创建个以标记的根结点，对数据集中的每笔事务......”。

6、“.....对剩余项目按照中的顺序进行排序，记作，其中表示排序后序列的第项，表示剩余项。调用方法将交易的频繁项插入到中。若有个子结点满足条件，也即两个，排列。然后，让辅助指针指向根结点，待新项添加到树中后，让辅助指针指向新添加的结点。每次结束个数据集的插入之后，都让辅助指针指向根结点。图显示了将和插入的具体步骤将整个事务数据库的交易都处理完毕之后，得到如下。挖掘频繁模式改进的算法使用频繁前缀以及频繁子孙集连接构成频繁项集，不必再去构建条件，这就减小了内存开销，在有相同项名的结点上。若不为空，方法会递归地调用。扫描所有的交易后，颗完整的被构建出来......”。

7、“.....挖掘过程需要在中建立好的原始结构中递归挖掘以得到频繁项集，在此过程中还需生成很多条件，具体步骤如下逆序遍历频繁项列表，对每项找出其条件模式基，以条件模式基的集合作为新的交易集递归结束前，变量和子函数占用的存储空间必须保留，当事务中有很多项目时，需要大量的递归，这时调用栈中的大量出栈入栈操作非常费时。此外，在建立好之后，对频繁模式的挖掘也是递归的，此过程还会产生很多条件，这也拉低了算法的效率，尤其是在数据集较大的情况下。建立。创建个以标记的根结点，对数据集中的每笔事务。删除中，范明......”。

8、“.....作者单位长治学院计算机系山西省长治市。基于频繁模式的挖掘算法论文基于频繁模式的挖掘算法论文原稿示图算法运行时间从图中可以看出，在数据量较小的情况下，两种算法花费的时间几乎相等。但是当处理较大数据量的时候，改进的算法所花费时间明显小于传统方法，效率有了定的提高。参考文献范明，孟小峰等译数据挖掘概念与技术北京机械工业出版社与频繁前缀组合得到频繁项集，。将步中得到的频繁项集组合并更新其支持度，得到新的频繁项集，。继续后根遍历，得到非叶子结点，其频繁子孙集，频繁前缀为。者连接得到频繁项集，与频繁前缀组合得到频繁集。合并得到的频繁集......”。

9、“.....并更新其支持算法建立的过程是递归的，会频繁进出栈，这就增加了内存开销，提高算法的时间复杂性，特别是在数据集很大的情况下。同时，在频繁模式的挖掘过程中需递归地构建条件树，这也会降低算法效率。本文从这两方面改进了算法，使之更有效率。以图中数据为例，改进后挖掘频繁项的过程如下自底向上后根遍历图中的，获得非叶子结点，计算出省长治市。基于频繁模式的挖掘算法论文原稿。以图中数据为例，改进后挖掘频繁项的过程如下自底向上后根遍历图中的，获得非叶子结点，计算出的频繁子孙集为。继续后根遍历，获得非叶子结点。其频繁子孙集为并找到的频繁前缀......”。

温馨提示：手指轻点页面，可唤醒全屏阅读模式，左右滑动可以翻页。