繁体   English   中英

项集中的规则挖掘算法是什么

[英]what algorithm for rules mining in itemsets

我有以下数据,每个条目都包含一个项集以及它属于哪个类(正或负)。

我可以使用什么算法来找出哪些项目组合表示正面或负面?

在下面的情况下,我想找出(B,C)表示正,(D,E)表示负。

B、C、 A -> 阳性

B、C、 D -> 阳性

B、C、 E -> 阳性

B、 D、E -> 阴性

C、 D、E -> 阴性

A、 D、E -> 阴性

结果:(B,C)表示阳性,(D,E)表示阴性。

我试过频繁项集和apriori,结果不好,还有其他可能的方法吗?

一个典型的算法可以被映射每个对items中的每个记录( itemset )到其positivenegative类,然后计数映射到任意的数目positive也不negative的类和比较结果知道哪个号码也更大。 这就是您要寻找的每一对类。

这是非常昂贵的,尤其是当您的itemsets包含大量项目时,通常,您需要某种数据结构来以快速有效的方式存储和检索数据。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM