[英]Python - how to create new columns in a dataframe from the unique values from an existing column with corresponding values?
[英]Create unique ID from the existing two columns, python
我的問題是:如何從現有的id列有效地簽署數據唯一ID號? 例如:我有兩列[household_id]和[person_no]。 我嘗試創建一個新列,查詢將是:household_id +'_'+ person_no。
這是一個示例:
hh_id pno
682138 1
365348 1
365348 2
想拿到:
unique_id
682138_1
365348_1
365348_2
並將此unique_id添加為新列。 我正在應用Python。 我的數據非常大。 任何有效的方法都會很棒。 謝謝!
你可以使用熊貓 。
假設您的數據位於csv文件中,請讀入數據:
import pandas as pd
df = pd.read_csv('data.csv', delim_whitespace=True)
創建新的id列:
df['unique_id'] = df.hh_id.astype(str) + '_' + df.pno.astype(str)
現在df
看起來像這樣:
hh_id pno unique_id
0 682138 1 682138_1
1 365348 1 365348_1
2 365348 2 365348_2
寫回csv文件:
df.to_csv('out.csv', index=False)
文件內容如下所示:
hh_id,pno,unique_id
682138,1,682138_1
365348,1,365348_1
365348,2,365348_2
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.