[英]Is there a python package that can find the most impactful group (categorical features) from my data?
我的問題是我有一個這樣的活動數據集:
| Customer | Province | District | City | Age | No. of Order |
| -------- | ------- | -------- | -----| ----| ------- |
| A | P1 | D1 | C1 | 21 | 5 |
| B | P2 | D2 | C2 | 22 | 9 |
....
我需要找到最有影響力的客戶群(通常會有>20個分類群)。 例如:“來自P1 省、 D1 區、 25 歲的客戶是最有前途的群體,因為他們貢獻了 50% 的總訂單,同時占我們客戶群的 10%”。
我目前正在使用 Pandas 從我的所有分類特征中遍歷 [2,3,4] 的所有組合並計算每個組的銷售比例,但這非常耗時
請問已經有Python package可以幫忙找那種群了嗎?
您可以使用決策樹自動執行此操作。
並非所有功能都可能有用。 使用 PCA(主成分分析)消除瑣碎的
您可以將 scikit-learn package 用於上述兩者。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.