如何将具有多个文本列表值的python字典拆分为具有相同值的键的单独字典？

Question

我有一本字典，其中有整数作为键，而列表则作为值。 这里显示一个小预览。

{85992: ['teardrop', 'list2015'], 86107: ['teardrop', 'list2015'], 82364: ['macron', 'paris', 'palace'], 516253: ['liberia', 'vietnam'], 746235: ['democratic', 'national'], 861073: ['macron', 'paris', 'palace']}

我想在相同的词典中输出具有相同列表值的键，以便为每个单独的值集绘制一个CSV文件，将具有相似值的键归类。 我的清单很大，所以我无法定义字典名称，因为我不知道会有多少个字典名称。

我设法使用熊猫对字典进行排序，以输出基于文本的排序列表，但我无法使用熊猫对其进行拆分。

import pandas as pd

data_file = pd.DataFrame(key_dict).transpose().reset_index()
data_file.columns = ['name_id' , 'text']
data_file.groupby('text')
data_file.set_index('name_id', inplace = True)
data_file.to_csv('key_dict.csv')

我想到了选项B，其中包含以其唯一的字典值（文本列表）命名的键列表。 但是，我的首选选择是拆分字典。

Answer 1

您可以将collections.defaultdict用于O（ n ）解决方案，记住使用tuple键，因为list不可散列：

from collections import defaultdict

d = {85992: ['teardrop', 'list2015'], 86107: ['teardrop', 'list2015'],
     82364: ['macron', 'paris', 'palace'], 516253: ['liberia', 'vietnam'],
     746235: ['democratic', 'national'], 861073: ['macron', 'paris', 'palace']}

dd = defaultdict(list)

for k, v in d.items():
    dd[tuple(v)].append(k)

print(dd)

defaultdict(list,
            {('democratic', 'national'): [746235],
             ('liberia', 'vietnam'): [516253],
             ('macron', 'paris', 'palace'): [82364, 861073],
             ('teardrop', 'list2015'): [85992, 86107]})

为每组值绘制一个CSV文件

对于问题的这一部分，只需迭代defaultdict ：

for k, v in dd.items():
    df = pd.DataFrame(v)
    df.to_csv('_'.join(k) + '.csv', index=False)

Answer 2

使用map ：

输入

from collections import defaultdict
key_dict={85992: ['teardrop', 'list2015'], 86107: ['teardrop', 'list2015'], 82364: ['macron', 'paris', 'palace'], 516253: ['liberia', 'vietnam'], 746235: ['democratic', 'national'], 861073: ['macron', 'paris', 'palace']}
d = {}
d = defaultdict(lambda: [], d)
counts = map(lambda x: d[tuple(key_dict[x])].append(x) , key_dict.keys())
print(d['macron', 'paris', 'palace'])
d

产量

[861073, 82364]
defaultdict(<function __main__.<lambda>>,
            {('democratic', 'national'): [746235],
             ('liberia', 'vietnam'): [516253],
             ('macron', 'paris', 'palace'): [861073, 82364],
             ('teardrop', 'list2015'): [85992, 86107]})

如何将具有多个文本列表值的python字典拆分为具有相同值的键的单独字典？

问题描述

2 个解决方案

解决方案1
2 已采纳 2018-11-26 11:50:02

解决方案2
0 2018-11-26 12:25:51

如何将具有多个文本列表值的python字典拆分为具有相同值的键的单独字典？

问题描述

2 个解决方案

解决方案1 2 已采纳 2018-11-26 11:50:02

解决方案2 0 2018-11-26 12:25:51

解决方案1
2 已采纳 2018-11-26 11:50:02

解决方案2
0 2018-11-26 12:25:51