簡體   English   中英

從其他 pandas 列創建新列

[英]Creating New columns from other pandas column

我想從流派列創建一個新 流派列包含一個或多個流派,我想為每個流派名稱創建一個列。 然后,我想根據他們是否有流派,在每列中填寫 1 和 0。

第一張圖片

數據框應如下圖所示。

以下

我對此一無所知。

立即使用一個熱編碼器或熊貓假人功能不起作用,因為我得到了這樣的東西

就在這兒

我不需要這樣的東西

看起來Genre列中的值是一次性編碼的。 One-hot 編碼也稱為創建虛擬變量。

Pandas 有一個函數pd.get_dummies()可以讓你對Genre列進行一次熱編碼。 傳入您的數據框並使用columns參數來選擇Genre列。

在此處查看函數文檔和其他選項: https ://pandas.pydata.org/docs/reference/api/pandas.get_dummies.html

您可以使用CategoricalDtype如下:

import pandas as pd
from pandas.api.types import CategoricalDtype

df = pd.DataFrame({'country': ['Brazil', 'Australia', 
'Canada','Brazil','Germany']})

pd.get_dummies(df,prefix=['country'])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM