1
4
好吧,我假设你读过维基百科的词条,但你说“一个基本的例子会让我更容易理解”。维基百科就是这样的,所以我假设你没有读过它,并建议你读。 阅读 wikipedia 文章。 |
2
6
见 Top 10 algorithms in data mining (免费访问)或 The Top Ten Algorithms in Data Mining . 后者给出了算法的详细描述,以及如何获得优化实现的详细信息。 |
3
6
先验算法它是数据集中频繁模式挖掘的候选生成和测试方法。有两件事你必须记住。 先验剪枝原理- 如果不经常出现任何项集,则不应生成/测试它的超集。
先验财产-
给定的
现在,这里是4个步骤中的先验算法。
解决实例
假设有一个如下的事务数据库,其中有4个事务,包括它们的事务ID和用它们购买的项目。假设最低支持-
事务数据库
现在,让我们创建候选人
如果我们用
现在,让我们第二次扫描数据库,并生成候选者
正如你所看到的,
现在,让我们对数据库进行第三次扫描,并找到候选人
你可以看到,
最后,我们可以计算
|
4
2
Apriori的最佳介绍可从本书下载: http://www-users.cs.umn.edu/~kumar/dmbook/index.php 你可以免费下载第6章,其中解释得很清楚。 此外,如果您想下载Apriori的Java版本和其他频繁项集挖掘算法,您可以查看我的网站: |
danial · 如何在多个字符串的每个位置找到最频繁的字符 2 年前 |
Manny · 如何比较Perl中的字符串? 2 年前 |
Diret · 获取范围内每个数字的子倍数的算法 2 年前 |
Saif · 排序时python如何决定何时调用比较器? 2 年前 |