簡體   English   中英

Pandas基於拆分另一列添加新列

[英]Pandas add new columns based on splitting another column

我有一個像下面這樣的pandas數據幀:

A              B
US,65,AMAZON   2016
US,65,EBAY     2016

我的目標是看起來像這樣:

A              B      country    code    com
US.65.AMAZON   2016   US         65      AMAZON
US.65.AMAZON   2016   US         65      EBAY

我知道在這里這里之前已經問過這個問題,但它們都不適合我。 我試過了:

df['country','code','com'] = df.Field.str.split('.')

df2 = pd.DataFrame(df.Field.str.split('.').tolist(),columns = ['country','code','com','A','B'])

我錯過了什么嗎? 任何幫助深表感謝。

您可以使用split with parameter expand=True並在左側添加一個[]

df[['country','code','com']] = df.A.str.split(',', expand=True)

然后replace ,.

df.A = df.A.str.replace(',','.')

print (df)
              A     B country code     com
0  US.65.AMAZON  2016      US   65  AMAZON
1    US.65.EBAY  2016      US   65    EBAY

如果沒有NaN值,則使用DataFrame構造函數的另一個解決方案:

df[['country','code','com']] = pd.DataFrame([ x.split(',') for x in df['A'].tolist() ])
df.A = df.A.str.replace(',','.')
print (df)
              A     B country code     com
0  US.65.AMAZON  2016      US   65  AMAZON
1    US.65.EBAY  2016      US   65    EBAY

您也可以在構造函數中使用列名,但是必須使用concat

df1=pd.DataFrame([x.split(',') for x in df['A'].tolist()],columns= ['country','code','com'])
df.A = df.A.str.replace(',','.')
df = pd.concat([df, df1], axis=1)
print (df)
              A     B country code     com
0  US.65.AMAZON  2016      US   65  AMAZON
1    US.65.EBAY  2016      US   65    EBAY

這將不會按預期給出輸出它只會給df ['A']第一個值'U'

可以根據提供的數據創建列df1 = pd.DataFrame([x.split(',')for d in df ['A']。tolist()],columns = ['country','code' , 'COM'])

而不是為lambda也可以使用

為了獲得新列,我更喜歡這樣做:

df['Country'] = df['A'].apply(lambda x: x[0])
df['Code'] = df['A'].apply(lambda x: x[1])
df['Com'] = df['A'].apply(lambda x: x[2])

至於更換 你可以使用以下內容:

df['A'] = df['A'].str.replace(',','.')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM