簡體   English   中英

如何將從單個分類變量創建的多個虛擬變量列合並到 python 中的單個列中?

[英]How to merge multiple dummy variables columns which were created from a single categorical variable into single column in python?

我正在研究具有許多分類變量的 IPL 數據集,其中一個變量是 toss_winner。 我為此創建了虛擬變量,現在我有 15 列具有二進制值。 我想將所有這些列合並為單列,每個數字代表 IPL 團隊的數字 0-14。

虛擬變量的屏幕截圖

IIUC,用途:

df['Team No.'] = dummies.cumsum(axis=1).ne(1).sum(axis=1)

例子,

df = pd.DataFrame({'Toss winner': ['Chennai', 'Mumbai', 'Rajasthan', 'Banglore', 'Hyderabad']})
dummies = pd.get_dummies(df['Toss winner'])
df['Team No.'] = dummies.cumsum(axis=1).ne(1).sum(axis=1)

結果:

# print(dummies)
   Banglore  Chennai  Hyderabad  Mumbai  Rajasthan
0         0        1          0       0          0
1         0        0          0       1          0
2         0        0          0       0          1
3         1        0          0       0          0
4         0        0          1       0          0

# print (df)
  Toss winner  Team No.
0     Chennai         1
1      Mumbai         3
2   Rajasthan         4
3    Banglore         0
4   Hyderabad         2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM