繁体   English   中英

Pandas 系列索引作为数据框的列名

[英]Pandas series index as column name of dataframe

任务描述

我有一个熊猫系列如下:

   rank   loc
    0.0     AU     2
            US     1
    1.0     UK     1
            AU     3
            US     1

我希望制作一个以 rank 作为列名和 loc 作为索引的 DataFrame。 所需的 df 如下所示:

     0.0    1.0
AU    2      3
UK           1
US    1      1

我对没有值的行中的 NaN 或 0 感到满意。 任何帮助都会很棒!

假设这个系列被称为 S。

首先将其展平并转换为数据框并重命名以便于访问

df = pd.DataFrame(pd.DataFrame(S).to_records())
df.columns = ['rank', 'loc', 'counts']

现在按loc分组,并遍历每个组并创建一个字典,其中“键”来自排名,“值”来自计数

对于每个组,您将拥有这个字典,您可以将其附加到temp_list ,而temp_indices跟踪索引(在这种情况下是loc的值)

最后,我们可以从字典列表( temp_list )中创建一个结果数据帧,索引来自temp_indices

temp_list = list()
temp_indices = list()

for _name, _val in df.groupby('loc'):
    temp_dict = dict()
    for _, row in _val.iterrows():
        temp_dict.update({row['rank']: row['counts']})
    temp_indices.append(_name)
    temp_list.append(temp_dict)

result = pd.DataFrame(temp_list, index=temp_indices)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM