繁体   English   中英

如何使用 Pandas 将多列合并为 1 个指标?

[英]How to merge multiple columns into 1 indicator by using Pandas?

我有数据集:

Class   2000    2001    2002    2003
A   1   2   3   4
B   5   5   4   4
C   2   1   5   6

我想得到这样的结果:

Class   Year    Value
A   2000    1
A   2001    2
A   2002    3
A   2003    4
B   2000    5
B   2001    5
B   2002    4
B   2003    4
C   2000    2
C   2001    1
C   2002    5
C   2003    6

请帮我!

您希望在 Pandas 中取消旋转 DataFrame,他们称之为“pandas.melt” [链接]

对于您的示例:

pandas.melt(df, id_vars=['Class'], value_vars=['2000','2001','2002','2003'])

您可以将pd.meltsort_values()一起使用。

由于执行sort_values()会使索引混乱,因此您reset_index然后重命名该列

import pandas as pd
from io import StringIO

d = '''Class   2000    2001    2002    2003
A   1   2   3   4
B   5   5   4   4
C   2   1   5   6'''

df = pd.read_csv(StringIO(d), sep='\s+')

df2 = pd.melt(df, id_vars=['Class'], value_vars=['2000','2001','2002','2003']).sort_values(by=['Class'])
df2 = df2.reset_index(drop=True)

df2 = df2.rename(columns={'variable':'Year'})
print(df2)

# output
  Class  Year  value
0      A  2000      1
1      A  2001      2
2      A  2002      3
3      A  2003      4
4      B  2000      5
5      B  2001      5
6      B  2002      4
7      B  2003      4
8      C  2000      2
9      C  2001      1
10     C  2002      5
11     C  2003      6

在线查询链接:在线查询

我在具有 pandas 功能的方法链中创建了它。

df = df.set_index('Class').unstack().reset_index().rename(columns={'level_0':'Year', 0:'Value'}).sort_values(['Class','Year']).reset_index(drop=True)

df
Year    Class   Value
0   2000    A   1
1   2001    A   2
2   2002    A   3
3   2003    A   4
4   2000    B   5
5   2001    B   5
6   2002    B   4
7   2003    B   4
8   2000    C   2
9   2001    C   1
10  2002    C   5
11  2003    C   6

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM