[英]Condenseing/converting a nested list using dictionary comprehension
所以我的数据结构化在一个嵌套列表中
data = [['A', '1'], ['B', '2'], ['C', '3'], ['A', '-2'], ['B', '4'], ['C', '1'], ['A', '2'], ['B', '1'], ['C', '-5']]
我正在尝试将其转换为如下所示的输出
{'A': 1, 'C': -1, 'B': 7}
基本上总结所有的 A、B 和 C,将输出作为字典。
我写了这段代码,给出了正确的答案
playerSum = {}
for ele in data:
if ele[0] not in playerSum:
playerSum[ele[0]] = int(ele[1])
else:
playerSum[ele[0]] += int(ele[1])
但是,我正在尝试将上面的代码块转换为字典理解。 我主要了解如何做到这一点,但我不明白如何将 += 写成字典理解。 任何关于结构的指导都会很棒。
到目前为止我有这个
playerSum = {ele[0]: int(ele[1]) if ele[0] not in playerSum else playerSum[ele[0]] += int(ele[1]) for ele in data}
编辑:所以@achampion 能够解决它。 谢谢!
{key: sum(int(v) for k, v in data if k==key) for key in set(k for k, _ in data)}
把它作为一种理解来做是不切实际的。
作为练习,您可以使用协程为您进行计数,但您可以有效地创建字典两次:
from collections import defaultdict
def count():
cache = defaultdict(int)
k, v = yield
while True:
cache[k] += v
k, v = yield cache[k]
counter = count() # Create coroutine
next(counter) # Prime coroutine
data = [['A', '1'], ['B', '2'], ['C', '3'], ['A', '-2'], ['B', '4'],
['C', '1'], ['A', '2'], ['B', '1'], ['C', '-5']]
{k: counter.send((k, int(v))) for k, v in data} # Meets the challenge :)
结果:
{'A': 1, 'B': 7, 'C': -1}
或者一个真正丑陋的单行,不需要协程并且不是二次的(不是理解):
>>> reduce(lambda d, (k,v): d.__setitem__(k, d.get(k,0)+int(v)) or d, data, {}) # Py2.7
{'A': 1, 'B': 7, 'C': -1}
最后是一个基于@Prune 的非常低效但真正的 dict 理解:
>>> {key: sum(int(v) for k, v in data if k==key) for key in set(k for k, _ in data)}
{'A': 1, 'B': 7, 'C': -1}
最好的方法是最明显的方法
from collections import defaultdict
playerSum = defaultdict(int)
for key, value in data:
playerSum[key] += int(value)
这是不可能使用字典理解为你的价值观会被覆盖,该字典还没有生成,直到理解完成即便如此,如果你能有什么好+ =。 就目前而言,除非您在某处有playerSum = {}
否则您的代码将出现 NameError 错误,如果您这样做,您只是将名称重新绑定到 dict comp 的结果,因此playerSum = {}
基本上什么都不做。
做你想做的唯一方法是按照你自己的解决方案。 为了更有效的方法您可以解压缩子列表并将第二个元素转换为 int,使用collections.defaultdict
对值求和:
from collections import defaultdict
d = defaultdict(int)
for a,b in data:
d[a] += int(b)
print(d)
defaultdict(<type 'int'>, {'A': 1, 'C': -1, 'B': 7})
或使用常规字典:
d = {}
for a, b in data:
d[a] = d.get(a,0) + int(b)
print(d)
{'A': 1, 'C': -1, 'B': 7}
正如你所问的,我是在一个单一的理解中做到的。
dict ([(key, sum(int(elem[1]) for elem in data if elem[0]==key)) for key in [id for id in set([elem[0] for elem in data])] ])
从外到内:
构建列表中使用的一组 ID。
对于每个 ID,列出相关值。
汇总列表。
发出(产生)ID 并成对求和。
将这个元组列表变成字典。
测试:
data = [['A', '1'], ['B', '2'], ['C', '3'],
['A', '-2'], ['B', '4'], ['C', '1'],
['A', '2'], ['B', '1'], ['C', '-5']]
playerSum = dict ([(key, sum(int(elem[1]) for elem in data if elem[0]==key))
for key in [id for id in set([elem[0] for elem in data])] ])
print data
print playerSum
结果:
[['A', '1'], ['B', '2'], ['C', '3'], ['A', '-2'], ['B', '4'], ['C', '1'], ['A', '2'], ['B', '1'], ['C', '-5']]
{'A': 1, 'C': -1, 'B': 7}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.