是否有 python package 可以從我的數據中找到最具影響力的組（分類特征）？

Question

我的問題是我有一個這樣的活動數據集：

| Customer | Province | District | City | Age | No. of Order |
| -------- | -------  | -------- | -----| ----| -------      |
| A        | P1       | D1       | C1   | 21  | 5            |
| B        | P2       | D2       | C2   | 22  | 9            |
....

我需要找到最有影響力的客戶群（通常會有>20個分類群）。 例如：“來自P1 省、 D1 區、 25 歲的客戶是最有前途的群體，因為他們貢獻了 50% 的總訂單，同時占我們客戶群的 10%”。

我目前正在使用 Pandas 從我的所有分類特征中遍歷 [2,3,4] 的所有組合並計算每個組的銷售比例，但這非常耗時

請問已經有Python package可以幫忙找那種群了嗎？

Answer 1

您可以使用決策樹自動執行此操作。

並非所有功能都可能有用。 使用 PCA（主成分分析）消除瑣碎的

您可以將 scikit-learn package 用於上述兩者。

是否有 python package 可以從我的數據中找到最具影響力的組（分類特征）？

問題描述

1 個解決方案

解決方案1
0 2021-01-22 07:44:15

是否有 python package 可以從我的數據中找到最具影響力的組（分類特征）？

問題描述

1 個解決方案

解決方案1 0 2021-01-22 07:44:15

解決方案1
0 2021-01-22 07:44:15