簡體   English   中英

Microsoft Excel 2003中的關聯/數據挖掘

[英]Correlations/Data Mining in Microsoft Excel 2003

我有一個Excel電子表格,其中每一列都是一個特定的變量。 在我的專欄的最后,我有一個特殊的最后一列,稱為“類型”,可以是A,B,C或D。

每行是一個具有不同變量的數據點,該數據點最終存儲在最后一列中記錄的某個“類型”存儲區(A / B / C / D)中。

我需要一種方法來檢查特定類型的所有條目(例如,“ C”或“ C” |“ D”),並找出哪個變量是最后一列的良好預測指標,而哪個更好比其他預測指標。

一些變量是數字,其他變量是固定的字符串(來自一組字符串),因此它不僅僅是數字/數字的相關性。

Excel 2003是實現這一目標的好工具,還是有更好的統計程序可以簡化此過程? 是否為每個類別創建數據透視圖/直方圖,還是有更好的方法來運行這些查詢? 謝謝

您可以使用Microsoft excel進行一些過濾,尤其是清理數據(我的意思是將數據值更改為一種類型,字符串或數字)。 Execl還進行了一些數據挖掘。 但是,對於您遇到的問題,我建議您使用WEKA作為一個好的工具。 使用此工具,可以對所有數據實例(行)進行關聯分類預測(即,類別關聯規則挖掘),因此,可以確定屬於A / B / C / D的項。 您的特殊屬性將是您的類屬性。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM