簡體   English   中英

從現有的兩列python中創建唯一ID

[英]Create unique ID from the existing two columns, python

我的問題是:如何從現有的id列有效地簽署數據唯一ID號? 例如:我有兩列[household_id]和[person_no]。 我嘗試創建一個新列,查詢將是:household_id +'_'+ person_no。

這是一個示例:

hh_id       pno  
 682138    1   
 365348    1     
 365348    2

想拿到:

unique_id
682138_1
365348_1
365348_2

並將此unique_id添加為新列。 我正在應用Python。 我的數據非常大。 任何有效的方法都會很棒。 謝謝!

你可以使用熊貓

假設您的數據位於csv文件中,請讀入數據:

import pandas as pd 

df = pd.read_csv('data.csv', delim_whitespace=True)

創建新的id列:

df['unique_id'] = df.hh_id.astype(str) + '_' + df.pno.astype(str)

現在df看起來像這樣:

    hh_id  pno unique_id
0  682138    1  682138_1
1  365348    1  365348_1
2  365348    2  365348_2

寫回csv文件:

df.to_csv('out.csv', index=False)

文件內容如下所示:

hh_id,pno,unique_id
682138,1,682138_1
365348,1,365348_1
365348,2,365348_2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM