簡體   English   中英

是否有 python package 可以從我的數據中找到最具影響力的組(分類特征)?

[英]Is there a python package that can find the most impactful group (categorical features) from my data?

我的問題是我有一個這樣的活動數據集:

| Customer | Province | District | City | Age | No. of Order |
| -------- | -------  | -------- | -----| ----| -------      |
| A        | P1       | D1       | C1   | 21  | 5            |
| B        | P2       | D2       | C2   | 22  | 9            |
....

我需要找到最有影響力的客戶群(通常會有>20個分類群)。 例如:“來自P1 省D1 區25 歲的客戶是最有前途的群體,因為他們貢獻了 50% 的總訂單,同時占我們客戶群的 10%”。

我目前正在使用 Pandas 從我的所有分類特征中遍歷 [2,3,4] 的所有組合並計算每個組的銷售比例,但這非常耗時

請問已經有Python package可以幫忙找那種群了嗎?

您可以使用決策樹自動執行此操作。

並非所有功能都可能有用。 使用 PCA(主成分分析)消除瑣碎的

您可以將 scikit-learn package 用於上述兩者。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM