使用R中的arules包進行關聯規則挖掘

Question

我正在嘗試使用R中的arules包查找關聯規則。我正在使用csv文件創建事務對象。 我收到的商品集不正確。 這就是數據的樣子

137,lidocaine
138,pregabalin
139,esomeprazole,nadolol,atorvastatin
140,hydromorphone
141,ondansetron,enoxaparin,metoclopramide
142,fluticasone
143,trandolapril,amlodipine,fluticasone,esomeprazole
144,meloxicam
145,lidocaine
146,atorvastatin
147,fluticasone
here is the R code I am using
library("arules")
txn <- read.transactions("basket.csv", rm.duplicates= TRUE,format="basket",sep=",",cols =1);
txn@itemInfo
The item list I am getting has repeated items
labels
1       amlodipine
2    atorvastatin"
3       enoxaparin
4     esomeprazole
5    esomeprazole"
6      fluticasone
7     fluticasone"
8   hydromorphone"
9       lidocaine"
10      meloxicam"
11 metoclopramide"
12         nadolol
13     ondansetron
14     pregabalin"
15    trandolapril

如果您查看項目4＆5，它們是相同的，但是由於引號引起的區別對待，項目6＆7的情況與此類似。

是否有解決此問題的方法或任何原因？

Answer 1

我不熟悉R工具，但是我是一名AI學生，並且對關聯規則了解得很少。

我認為這與您的數據文件有關。 如果您記下項目列表，則會看到數據文件中行末的每個項目在項目列表中都帶有引號，反之亦然。

因此，這些項目出現兩次的原因是，它們在日期文件的行尾出現了一次，在行中間出現了另一次。

再說一遍，我對R工具不熟悉，但是我認為一個簡單的更正，例如在數據文件所有行的末尾添加一個空格將解決此問題。

使用R中的arules包進行關聯規則挖掘

問題描述

1 個解決方案

解決方案1
0 2014-07-25 20:26:29

使用R中的arules包進行關聯規則挖掘

問題描述

1 個解決方案

解決方案1 0 2014-07-25 20:26:29

解決方案1
0 2014-07-25 20:26:29