繁体   English   中英

如果 dict 与另一个“相似”,则将值附加到 dict 键

[英]Appending value to dict key if dict is “similar” to another one

首先,对不起标题,老实说,我想不出一个好的标题。

我有一个这样的字典列表

data=[
{'identifier': 'ID', 'resource': 'resource1' , 'name': 'name1'},
{'identifier': 'ID', 'resource': 'resource2' , 'name': 'name1'},
{'identifier': 'ID', 'resource': 'resource3' , 'name': 'name1'},
{'identifier': 'ID', 'resource': 'resource1' , 'name': 'name2'},
{'identifier': 'ID', 'resource': 'resource2' , 'name': 'name2'},
{'identifier': 'ID', 'resource': 'resource3' , 'name': 'name2'}
]

基本上,我想要一个包含名称和具有该名称的每个资源的字典,就像这样

final = [
{
'name': 'name1',
'resources': ['resource1','resource2','resource3']
},
{
'name': 'name2',
'resources': ['resource1','resource2','resource3']
}
]

我尝试了一些方法,例如遍历第一个列表并验证第二个列表中是否已经存在key value对,因此之后我可以将资源 append 分配给我想要的键,但显然这不是正确的方法。

我确定有一种方法可以轻松做到这一点,但我无法解决如何实现它。 关于如何做到这一点的任何想法?

使用collections.defaultdict进行分组, name作为分组键,每个名称的资源附加到列表中:

from collections import defaultdict

data = [
    {"identifier": "ID", "resource": "resource1", "name": "name1"},
    {"identifier": "ID", "resource": "resource2", "name": "name1"},
    {"identifier": "ID", "resource": "resource3", "name": "name1"},
    {"identifier": "ID", "resource": "resource1", "name": "name2"},
    {"identifier": "ID", "resource": "resource2", "name": "name2"},
    {"identifier": "ID", "resource": "resource3", "name": "name2"},
]

d = defaultdict(list)
for x in data:
    d[x["name"]].append(x["resource"])

result = [{"name": k, "resources": v} for k, v in d.items()]

print(result)

但是,由于您的名字是有序的,我们也可以使用itertools.groupby

from itertools import groupby
from operator import itemgetter

result = [
    {"name": k, "resources": [x["resource"] for x in g]}
    for k, g in groupby(data, key=itemgetter("name"))
]

print(result)

如果您的姓名没有排序,那么我们将需要按namedata进行排序:

result = [
    {"name": k, "resources": [x["resource"] for x in g]}
    for k, g in groupby(sorted(data, key=itemgetter("name")), key=itemgetter("name"))
]

print(result)

Output:

[{'name': 'name1', 'resources': ['resource1', 'resource2', 'resource3']}, {'name': 'name2', 'resources': ['resource1', 'resource2', 'resource3']}]

注意:在大多数情况下,我可能会坚持使用第一个defaultdict解决方案,因为它不关心顺序。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM