[英]what algorithm for rules mining in itemsets
我有以下數據,每個條目都包含一個項集以及它屬於哪個類(正或負)。
我可以使用什么算法來找出哪些項目組合表示正面或負面?
在下面的情況下,我想找出(B,C)表示正,(D,E)表示負。
B、C、 A -> 陽性
B、C、 D -> 陽性
B、C、 E -> 陽性
B、 D、E -> 陰性
C、 D、E -> 陰性
A、 D、E -> 陰性
結果:(B,C)表示陽性,(D,E)表示陰性。
我試過頻繁項集和apriori,結果不好,還有其他可能的方法嗎?
一個典型的算法可以被映射每個對items
中的每個記錄( itemset
)到其positive
或negative
類,然后計數映射到任意的數目positive
也不negative
的類和比較結果知道哪個號碼也更大。 這就是您要尋找的每一對類。
這是非常昂貴的,尤其是當您的itemsets
包含大量項目時,通常,您需要某種數據結構來以快速有效的方式存儲和檢索數據。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.