[英]How to merge multiple columns into 1 indicator by using Pandas?
我有数据集:
Class 2000 2001 2002 2003
A 1 2 3 4
B 5 5 4 4
C 2 1 5 6
我想得到这样的结果:
Class Year Value
A 2000 1
A 2001 2
A 2002 3
A 2003 4
B 2000 5
B 2001 5
B 2002 4
B 2003 4
C 2000 2
C 2001 1
C 2002 5
C 2003 6
请帮我!
您希望在 Pandas 中取消旋转 DataFrame,他们称之为“pandas.melt” [链接]
对于您的示例:
pandas.melt(df, id_vars=['Class'], value_vars=['2000','2001','2002','2003'])
您可以将pd.melt与sort_values()一起使用。
由于执行sort_values()
会使索引混乱,因此您reset_index然后重命名该列
import pandas as pd
from io import StringIO
d = '''Class 2000 2001 2002 2003
A 1 2 3 4
B 5 5 4 4
C 2 1 5 6'''
df = pd.read_csv(StringIO(d), sep='\s+')
df2 = pd.melt(df, id_vars=['Class'], value_vars=['2000','2001','2002','2003']).sort_values(by=['Class'])
df2 = df2.reset_index(drop=True)
df2 = df2.rename(columns={'variable':'Year'})
print(df2)
# output
Class Year value
0 A 2000 1
1 A 2001 2
2 A 2002 3
3 A 2003 4
4 B 2000 5
5 B 2001 5
6 B 2002 4
7 B 2003 4
8 C 2000 2
9 C 2001 1
10 C 2002 5
11 C 2003 6
在线查询链接:在线查询
我在具有 pandas 功能的方法链中创建了它。
df = df.set_index('Class').unstack().reset_index().rename(columns={'level_0':'Year', 0:'Value'}).sort_values(['Class','Year']).reset_index(drop=True)
df
Year Class Value
0 2000 A 1
1 2001 A 2
2 2002 A 3
3 2003 A 4
4 2000 B 5
5 2001 B 5
6 2002 B 4
7 2003 B 4
8 2000 C 2
9 2001 C 1
10 2002 C 5
11 2003 C 6
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.