[英]Appending two dataframes with same columns, different order
我有两个pandas数据帧。
noclickDF = DataFrame([[0,123,321],[0,1543,432]], columns=['click', 'id','location'])
clickDF = DataFrame([[1,123,421],[1,1543,436]], columns=['click', 'location','id'])
我只是想加入,以便最终的DF看起来像:
click | id | location
0 123 321
0 1543 432
1 421 123
1 436 1543
正如您所看到的,两个原始DF的列名相同,但顺序不同。 列中也没有连接。
你也可以使用pd.concat :
In [36]: pd.concat([noclickDF, clickDF], ignore_index=True)
Out[36]:
click id location
0 0 123 321
1 0 1543 432
2 1 421 123
3 1 436 1543
在引擎盖下, DataFrame.append
调用pd.concat
。 DataFrame.append
具有用于处理各种类型输入的代码,例如Series,元组,列表和dicts。 如果你传递一个DataFrame,它会直接传递给pd.concat
,所以使用pd.concat
会更直接。
对于未来的用户(有时> pandas 0.23.0 ):
您可能还需要添加sort = True以在非连接轴尚未对齐时对其进行排序(即保留OP所需的连接行为)。 我使用上面提供的代码并收到警告,请参阅Python Pandas用户警告 。 下面的代码有效并且不会发出警告。
In [36]: pd.concat([noclickDF, clickDF], ignore_index=True, sort=True)
Out[36]:
click id location
0 0 123 321
1 0 1543 432
2 1 421 123
3 1 436 1543
您可以使用追加
df = noclickDF.append(clickDF)
print df
click id location
0 0 123 321
1 0 1543 432
0 1 421 123
1 1 436 1543
如果需要,可以重置索引
df.reset_index(drop=True)
print df
click id location
0 0 123 321
1 0 1543 432
2 1 421 123
3 1 436 1543
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.