[英]what algorithm for rules mining in itemsets
我有以下数据,每个条目都包含一个项集以及它属于哪个类(正或负)。
我可以使用什么算法来找出哪些项目组合表示正面或负面?
在下面的情况下,我想找出(B,C)表示正,(D,E)表示负。
B、C、 A -> 阳性
B、C、 D -> 阳性
B、C、 E -> 阳性
B、 D、E -> 阴性
C、 D、E -> 阴性
A、 D、E -> 阴性
结果:(B,C)表示阳性,(D,E)表示阴性。
我试过频繁项集和apriori,结果不好,还有其他可能的方法吗?
一个典型的算法可以被映射每个对items
中的每个记录( itemset
)到其positive
或negative
类,然后计数映射到任意的数目positive
也不negative
的类和比较结果知道哪个号码也更大。 这就是您要寻找的每一对类。
这是非常昂贵的,尤其是当您的itemsets
包含大量项目时,通常,您需要某种数据结构来以快速有效的方式存储和检索数据。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.