如何將一列中的值傳播到其他列中的行（熊貓數據框）

Question

我有這種格式的原始數據（輸入實際上是一個巨大的 excel 表），由於一列中的唯一值生成了多行，有點像這個例子：

data = [['tom', 10, 'vanilla'], ['tom', 10, 'chocolate'], ['nick', 15, 'strawberry'], ['nick', 15, 'butter pecan'], ['nick', 15, 'mint chocolate chip'], ['juli', 14, 'strawberry'], ['juli', 14, 'chocolate'], ['juli', 14, 'vanilla']]
df = pd.DataFrame(data, columns = ['Name', 'Age', 'Favorite Ice Cream'])

但我需要從上面的原始數據以下面的格式創建一個數據框，其中最后一列被擴展為行並消除重復的行：

data2 = [['tom', 10, 'vanilla', 'chocolate', '', ''], ['nick', 15, 'butter pecan', '', 'strawberry', 'mint chocolate chip'], ['juli', 14, 'vanilla', 'chocolate', 'strawberry', '']]
df2 = pd.DataFrame(data, columns = ['Name', 'Age', 'Favorite Vanilla-based Ice Cream',  'Favorite Chocolate-based Ice Cream',  'Favorite Berry Ice Cream', 'Favorite Other Ice Cream'])

感謝您的幫助！

Answer 1

使用pivot和映射字典：

mapping = {'Vanilla': ['vanilla', 'butter pecan'],
           'Chocolate': ['chocolate'],
           'Berry': ['strawberry']}

reverse_mapping = {v: k for k, l in mapping.items() for v in l}

df['X-based'] = df['Favorite Ice Cream'].map(reverse_mapping).fillna('Other')

out = df.pivot(index=['Name', 'Age'],
               columns='X-based',
               values='Favorite Ice Cream') \
        .rename_axis(columns=None).reset_index().fillna('')

輸出：

>>> out
   Name  Age       Berry  Chocolate                Other       Vanilla
0  juli   14  strawberry  chocolate                            vanilla
1  nick   15  strawberry             mint chocolate chip  butter pecan
2   tom   10              chocolate                            vanilla

如何將一列中的值傳播到其他列中的行（熊貓數據框）

問題描述

1 個解決方案

解決方案1
1 2021-11-09 21:21:27

如何將一列中的值傳播到其他列中的行（熊貓數據框）

問題描述

1 個解決方案

解決方案1 1 2021-11-09 21:21:27

解決方案1
1 2021-11-09 21:21:27