簡體   English   中英

如何在 Pandas 數據幀列上並行應用函數?

[英]How to apply a function on pandas dataframe columns in parallel?

我有一個1million X 1000維的熊貓數據1million X 1000 列是分類變量。 我想對它們進行編碼。

我已經從 sklearn 獲得了編碼模型並安裝了它。 現在想要並行轉換我的數據幀的列。

transformed_X = encoding_model.transform(X)

上面的 X 是我要編碼的數據幀。這里它以串行方式進行。 有沒有辦法將變換函數並行應用到我的數據框 X 的每一列?

如果您嘗試對分類變量進行 1 熱編碼,則可以使用pd.get_dummies()函數

df = pd.get_dummies(df)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM