簡體   English   中英

如何使用預定義值隨機填充 pandas dataframe 中的分類列

[英]How to randomly populate a categorical column in pandas dataframe using pre-defined values

我有兩個 pandas 數據框,第一個包含 50 多個城市的名稱,第二個包含客戶詳細信息,如姓名、年齡、性別、薪水、職業等。這些數據框之間沒有公共鍵,它們的大小也不同。 我希望在客戶詳細信息 dataframe 中填充一個名為“客戶城市”的新列,該列應從城市 dataframe 中選擇值。換句話說,對於一個客戶,我希望選擇一個隨機城市(來自城市數據框)並將其添加到客戶 dataframe 中名為“客戶城市”的新列。

請建議如何在 pandas 中完成此操作。

只是 select 他們來自城市 numpy 隨機選擇。 不確定城市 dataframe 是什么樣子,因此您可能必須更改該位才能使用您擁有的內容。

import numpy as np

df["Customer City"] = np.random.choice(cities, len(df))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM