[英]Addition of 2 dataframes column to column by unique column in pandas
我有2個數據框
df1
a b c
1 2 3
2 4 5
3 6 7
和
df2
a b c
1 3 4
3 1 8
我希望輸出是
df3
a b c
1 5 7
2 4 5
3 7 15
我嘗試了df1.add(df2,axis='c')
但沒有得到准確的輸出。
引用此鏈接http://pandas.pydata.org/pandas-docs/stable/genic/pandas.DataFrame.add.html
您需要在df
a
列a
set_index
中add
和參數fill_value=0
。
最后在必要時將值轉換為int
和reset_index
:
df = df1.set_index('a').add(df2.set_index('a'),fill_value=0).astype(int).reset_index()
print (df)
a b c
0 1 5 7
1 2 4 5
2 3 7 15
對於刪除不常用的行省略fill_value
並添加dropna
如果沒有NaN
兩個DataFrames
df = df1.set_index('a').add(df2.set_index('a')).dropna().astype(int).reset_index()
print (df)
a b c
0 1 5 7
1 3 7 15
也許您可以嘗試以下方法:
>>> import pandas as pd
>>>
>>> df1 = pd.DataFrame([(1, 2, 3), (2, 4, 5), (3, 6, 7)], columns=['a', 'b', 'c'])
>>>
>>> df2 = pd.DataFrame([(1, 3, 4), (3, 1, 8)], columns=['a', 'b', 'c'])
>>>
>>> df1.index = df1['a']
>>> del df1['a']
>>>
>>> df2.index = df2['a']
>>> del df2['a']
>>>
>>> df1.add(df2, fill_value=0)
b c
a
1 5.0 7.0
2 4.0 5.0
3 7.0 15.0
或使用set_index()
方法:
>>> df1.set_index('a').add(df2.set_index('a'), fill_value=0)
b c
a
1 5.0 7.0
2 4.0 5.0
3 7.0 15.0
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.