Pandas 從 substring 列中找到最大數量

Question

我有一個 dataframe 看起來像這樣

0       1                                              2                                       3                    
0   {'Emotion': 'female_angry', 'Score': '90.0%'}   {'Emotion': 'female_disgust', 'Score': '0.0%'}  {'Emotion': 'female_fear', 'Score': '0.0%'}
1   {'Emotion': 'female_angry', 'Score': '0.0%'}    {'Emotion': 'female_disgust', 'Score': '0.0%'}  {'Emotion': 'female_fear', 'Score': '80.0%'}    
2   {'Emotion': 'female_angry', 'Score': '0.1%'}    {'Emotion': 'female_disgust', 'Score': '99.0%'} {'Emotion': 'female_fear', 'Score': '4.6%'}

我想根據最高分值制作一個單獨的列。

像這樣

       Emotion

0      'female_angry'  

1      'female_fear'

2      'female_disgust'

我經歷了很多參考，但我無法解決我的問題。 有什么建議么？

Answer 1

您可以使用pandas.apply和axis=1來遍歷每一行：

df_new = df.apply(lambda row: max([tuple(dct.values()) for dct in row], 
                                  key= lambda x: x[1]
                                 )[0], axis=1).to_frame(name = 'Emotion')
print(df_new)

Output：

          Emotion
0    female_angry
1     female_fear
2  female_disgust

解釋：

>>> df.apply(lambda row: [tuple(dct.values()) for dct in row], axis=1)
# [('female_angry', '90.0%'), ('female_disgust', '0.0%'), ('female_fear', '0.0%')]
# [('female_angry', '0.0%'), ('female_disgust', '0.0%'), ('female_fear', '80.0%')]
# [('female_angry', '0.1%'), ('female_disgust', '99.0%'), ('female_fear', '4.6%')]

>>> max([('female_angry', '90.0%'), ('female_disgust', '0.0%'), ('female_fear', '0.0%')],
   key=lambda x : x[1])
# ('female_angry', '90.0%')

>>> ('female_angry', '90.0%')[0]
# 'female_angry'

Pandas 從 substring 列中找到最大數量

問題描述

1 個解決方案

解決方案1
1 已采納 2022-09-06 20:55:44

Pandas 從 substring 列中找到最大數量

問題描述

1 個解決方案

解決方案1 1 已采納 2022-09-06 20:55:44

解決方案1
1 已采納 2022-09-06 20:55:44