[英]Pandas Dataframe, how to group columns together in Python
我有一个熊猫数据框,我想对一些列进行分组以构建更高级别的列:
例子:我有
Index A B C D
1 0.25 0.3 0.25 0.66
2 0.25 0.3 0.25 0.66
3 0.25 0.3 0.25 0.66
而且我要
Index AB || CD
Subindex A | B || C | D
1 0.25 | 0.3 || 0.25 | 0.66
2 0.25 | 0.3 || 0.25 | 0.66
3 0.25 | 0.3 || 0.25 | 0.66
感谢您的帮助...
创建一个字典来定义你的映射并使用pd.MultiIndex.from_tuples
。 如果需要,您还可以指定names=['level_0', 'level_1']
来添加名称。
import pandas as pd
d = {'A': 'AB', 'B': 'AB', 'C': 'CD', 'D': 'CD'}
df.columns = pd.MultiIndex.from_tuples([*zip(map(d.get, df), df)])
# Equivalently
# df.columns = pd.MultiIndex.from_tuples([(d[col], col) for col in df.columns])
输出:
AB CD
A B C D
Index
1 0.25 0.3 0.25 0.66
2 0.25 0.3 0.25 0.66
3 0.25 0.3 0.25 0.66
groupby
/ concat
hackm = {'A': 'AB', 'B': 'AB', 'C': 'CD', 'D': 'CD'}
pd.concat(dict((*df.groupby(m, 1),)), axis=1)
AB CD
A B C D
Index
1 0.25 0.3 0.25 0.66
2 0.25 0.3 0.25 0.66
3 0.25 0.3 0.25 0.66
请注意,使用此方法可以选择原始 DataFrame 中列的任意子集,而替代答案似乎需要父 DataFrame 中所有值的有效字典映射
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.