繁体   English   中英

我如何在python的嵌套字典中找到项目的最大值?

[英]How do i find the largest value of an item in a nested dict in python?

我有以下带有嵌套字典“Emotions”的字典:

我试图找到一种简单的方法来返回具有最大 2 个“置信度”值的前 2 个情感“类型”(在这个字典的情况下,它是“CONFUSED”和“ANGRY”

[
    {
        "AgeRange": {
            "High": 52,
            "Low": 36
        },
        "Emotions": [
            {
                "Confidence": 22.537073135375977,
                "Type": "ANGRY"
            },
            {
                "Confidence": 1.3983955383300781,
                "Type": "SAD"
            },
            {
                "Confidence": 1.2260702848434448,
                "Type": "DISGUSTED"
            },
            {
                "Confidence": 2.291703939437866,
                "Type": "FEAR"
            },
            {
                "Confidence": 8.114240646362305,
                "Type": "HAPPY"
            },
            {
                "Confidence": 10.546235084533691,
                "Type": "SURPRISED"
            },
            {
                "Confidence": 18.409439086914062,
                "Type": "CALM"
            },
            {
                "Confidence": 35.47684097290039,
                "Type": "CONFUSED"
            }
        ],
    }
]

我试过dictmax = max(dict[Emotions][Confidence] key=dict.get)但这似乎不起作用,我不知所措。 我觉得应该有一种简单的方法来检索类型,基于 Confidence 的值。

你可以试试这个。

for d in my_list:
    out=sorted(d['Emotions'],key=lambda x:x['Confidence'],reverse=True)[:2]

[{'Confidence': 35.47684097290039, 'Type': 'CONFUSED'},
 {'Confidence': 22.537073135375977, 'Type': 'ANGRY'}]

您也可以使用nlargest

from heapq import nlargest
for d in a:
    out=nlargest(2,d['Emotions'],key=lambda x:x['Confidence'])

Ch3steR 的答案有效,但我想提出一个带有pandas的解决方案,它是一个用于处理数据分析的库(使用 DataFrame 对象,可以轻松进行数据操作)。

在您的示例中,让我们仅获取示例的相关部分:

emotions = [{'Confidence': 22.537073135375977, 'Type': 'ANGRY'},
 {'Confidence': 1.3983955383300781, 'Type': 'SAD'},
 {'Confidence': 1.2260702848434448, 'Type': 'DISGUSTED'},
 {'Confidence': 2.291703939437866, 'Type': 'FEAR'},
 {'Confidence': 8.114240646362305, 'Type': 'HAPPY'},
 {'Confidence': 10.546235084533691, 'Type': 'SURPRISED'},
 {'Confidence': 18.409439086914062, 'Type': 'CALM'},
 {'Confidence': 35.47684097290039, 'Type': 'CONFUSED'}]

这可以转换为一个 pandas DataFrame 对象:

import pandas as pd
pd.DataFrame(emotions)

产量

    Confidence  Type
0   22.537073   ANGRY
1   1.398396    SAD
2   1.226070    DISGUSTED
3   2.291704    FEAR
4   8.114241    HAPPY
5   10.546235   SURPRISED
6   18.409439   CALM
7   35.476841   CONFUSED

此对象可以按任何列(例如 Confidence)排序,使用.sort_values方法,可以使用.tail(2)方法选择最后两行(或任何其他数量)的行,最后是 'Type' 列可以选择。 总结一下:

pd.DataFrame(emotions).sort_values('Confidence').tail(2)['Type'].values

产量

array(['ANGRY', 'CONFUSED'], dtype=object)

如果你想要前 1,而不是前 n(对于 n>1),搜索最大值而不是排序更快更简单:

emotions.loc[emotions['Confidence'].idxmax(),'Type']

产量

'CONFUSED'

这并不比 Ch3steR 的答案快,但代码更直接(一旦您了解了 pandas 库),并且易于“扩展”到您以后可能需要的更复杂的数据分析。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM