簡體   English   中英

按某個鍵合並字典列表

[英]merge a list of dicts by a certain key

我有一個由相同結構的dict組成的list

sample = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]

我想通過鍵a組合它們,輸出應該是

[{'a': 1, 'd': [{'b':2, 'c':3}, {'b':2, 'c':4}]}, {'a': 2, 'd': [{'b':2, 'c':5}, {'b': 3, 'c':5}]}]

您可以使用itertools.groupby

>>> from itertools import groupby
>>> result = []
>>> for key, group in groupby(sorted(sample, key=lambda x:x['a']), key=lambda x:x.pop('a')):
        result.append({'a':key, 'd':[*group]})
>>> result
[{'a': 1, 'd': [{'b': 2, 'c': 3}, {'b': 2, 'c': 4}]},
 {'a': 2, 'd': [{'b': 2, 'c': 5}, {'b': 3, 'c': 5}]}]

注意:如果保證字典列表按 key a的值排序,則不需要sorted

按鍵組合:

dict_list = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]
new_dict = {}

for d in dict_list:
    a = d.pop('a', None)
    if new_dict.get(a):
         new_dict[a].append(d)
    else:
        new_dict[a] = [d]

轉換為列表:

final_list = [{'a': key, 'd': value} for key, value in new_dict.items()]
print(final_list)
[{'a': 1, 'd': [{'c': 3, 'b': 2}, {'c': 4, 'b': 2}]}, {'a': 2, 'd': [{'c': 5, 'b': 2}, {'c': 5, 'b': 3}]}]
sample = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]


tmp = {}
for v in sample:
    tmp.setdefault(v['a'], []).append(v)
    del v['a']

out = [{'a': k, 'd': v} for k, v in tmp.items()]

from pprint import pprint
pprint(out)

印刷:

[{'a': 1, 'd': [{'b': 2, 'c': 3}, {'b': 2, 'c': 4}]},
 {'a': 2, 'd': [{'b': 2, 'c': 5}, {'b': 3, 'c': 5}]}]

不幸的是,這可能是一個有點曲折的代碼,但它有效:

from itertools import groupby

sample = [{'a':1, 'b':2, 'c':3},
          {'a':1, 'b':2, 'c':4},
          {'a':2, 'b':2, 'c':5},
          {'a':2, 'b':3, 'c':5}]

main_key = "a"

print(
    [{main_key:k,
      "d": [{kk: vv for kk, vv in dct.items() if kk != main_key}
            for dct in v]}
     for k, v in groupby(sample, lambda d:d[main_key])]
)

給出:

[{'a': 1, 'd': [{'b': 2, 'c': 3}, {'b': 2, 'c': 4}]},
 {'a': 2, 'd': [{'b': 2, 'c': 5}, {'b': 3, 'c': 5}]}]

(為了便於閱讀,輸出打印得稍微漂亮)

使用 Pandas 進行查詢的替代解決方案。

import pandas as pd
sample = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]

df=pd.DataFrame(sample)

這將使用上述示例列表創建 DataFrame df 下一步是遍歷 GroupBy Object 並根據需要創建 output。

final_list=[]
for i, temp_df in df.groupby('a'):
    temp_list=[]
    for j in temp_df.index:
        temp_list.append({'b':temp_df.loc[:,'b'][j],'c':temp_df.loc[:,'c'][j]})
    final_list.append({'a':temp_df.loc[:,'a'][j],'d':temp_list})

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM