[英]Join data from one column in to another column as a separate row
我有一个 pandas DataFrame 这样的:
Year1 Year2 Total
0 2010 2011 2500
1 2012 2013 3000
2 2014 2015 4000
我想获取Year1
Year2
合并,并保持与之关联的Total
值,它应该如下所示:
Year1 Total
0 2010 2500
1 2011 2500
2 2012 3000
3 2013 3000
4 2014 4000
5 2015 4000
我首先考虑复制df
,以便获得 2011、2013 和 2015 的第二个“总计”值
df = pd.DataFrame(np.repeat(df.values, 2, axis=0))
df.columns = ['Year1', 'Year2', 'Total']
但我仍然不确定将列数据从Year2
合并到Year1
的步骤。
您可以使用append
function 实现所需的 output 但之前需要执行几个步骤:
import pandas as pd
df = pd.read_csv('df.txt')
newDf = df[["Year2", "Total"]].rename(columns={"Year2":"Year1"})
df.drop(columns=["Year2"], inplace=True)
resultDf = df.append(newDf)
resultDf.sort_values("Year1")
第一年 | 全部的 |
---|---|
2010 | 2500 |
2011年 | 2500 |
2012 | 3000 |
2013 | 3000 |
2014 | 4000 |
2015年 | 4000 |
你可以melt
它:
out = (pd.melt(df, id_vars=['Total']).rename(columns={'value':'Year1'})
.drop(columns='variable')[['Year1', 'Total']]
.sort_values(by='Year1').reset_index(drop=True))
或set_index
与 "Total" + unstack
:
out = (df.set_index('Total').unstack().droplevel(0)
.reset_index(name='Year1')[['Year1', 'Total']]
.sort_values(by='Year1').reset_index(drop=True))
Output:
Year1 Total
0 2010 2500
1 2011 2500
2 2012 3000
3 2013 3000
4 2014 4000
5 2015 4000
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.