簡體   English   中英

當數據框的行中有要素時,如何使用python選擇要素

[英]How to select features, using python, when dataframe has features in rows

我的數據框是這樣的:其中px1,px2,... px99是占位符,並在數據框中顯示為列。 它具有像5569、5282等的值,這是要選擇的真實特征。 這些功能成千上萬。 我想過濾重要功能。 嘗試使用隨機森林。 我知道我可以過濾隨機森林中的Px,但是實際嵌入的功能如何? 我正在使用python。

px1 px2 px3 px4 px5 px6 px7 px8 px9 px10

5569 5282 93
5569 5280 93 9904
5569 5282 93 93 3893 8872 3897 9904
5569 5280 5551 93 93 3995 8607
5569 5280 93 8867
5282 5569 93 9904 93

您不需要多於2列,因為時間順序無關緊要,所以

df = pds.concat([df[['px1',col]].rename(columns={col:'px2'}) for col in df.columns],\
                 axis=0,join='outer').dropna()

現在,由於僅考慮第一個變量,因此必須看到:

for label,dist in df.groupby('px1')['px2']:
   dist.hist(bins=len(dist.unique()),label=label)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM