[英]Pandas - combine two unstacked data frames
我正在处理一个数据集,在该数据集中我将数据拆栈,并获得第一行和最后一行。
>>> print df.iloc[[(0), (-1)]]
Distance
Node 0 1 2
Time
0 27.0 54.0 97.0
60 22.0 49.0 92.0
然后我使用df1 = (df.loc[0] - df.iloc[(-1)]).unstack()
得到两行的差
Node 0 1 2
Distance 5.0 5.0 5.0
最后,我想串联/合并两个数据集( df
和df1
)。
>>> print pd.concat([df, df1], axis=1)
(Distance, 0) (Distance, 1) (Distance, 2)
0 27.0 54.0 NaN
60 22.0 49.0 92.0
Distance NaN NaN NaN
但我得到了NaN
。
有人知道我在做什么错吗?
我希望我的输出看起来像这样
Distance
Node 0 1 2
Time
0 27.0 54.0 97.0
60 22.0 49.0 92.0
Difference 5.0 5.0 5.0
我认为,您要实现的目标不需要使用unstack
。 以下是一些替代方案。 为了简化格式,我省略了索引和列名。
df = pd.DataFrame({0: [27.0, 22.0], 1: [54.0, 49.0], 2: [97.0, 92.0]},
index=[0, 60])
print(df)
0 1 2
0 27.0 54.0 97.0
60 22.0 49.0 92.0
通过带有行标签的pd.DataFrame.loc
通过索引添加新行。
df.loc['Distance'] = df.loc[0] - df.iloc[-1]
将差异序列转换为数据框,然后转置并连接。
diff = (df.loc[0] - df.iloc[-1]).to_frame().T
diff.index = ['Distance']
res = pd.concat([df, diff])
结果
两种方法的结果:
print(res)
0 1 2
0 27.0 54.0 97.0
60 22.0 49.0 92.0
Distance 5.0 5.0 5.0
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.