[英]Python - Summing elements on list of lists based on first element of inner lists
我有一份清單
[[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
我要求輸出匯總每個子列表中的第二個元素,以獲得唯一的第一個元素。 在這種情況下,它是:
[[0.5, 7], [2, 9.6], [7, 1]]
其中[0.5, 7]
是[0.5, 2]
和[0.5, 5]
[0.5, 2]
的第二個元素的總和。
對於長度為1,000的列表,最有效的方法是什么。
累積defaultdict
:
>>> from collections import defaultdict
>>> data = defaultdict(int)
>>> L = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
>>> for k, v in L:
... data[k] += v
...
>>> [[k,v] for (k,v) in data.items()]
[[0.5, 7], [2, 9.6], [7, 1]]
請注意,2的值通過添加自動“提升”為浮點數,即使這是int的默認值。 這是為了匹配問題中發布的所需輸出,但我認為您應該考慮使用同類輸出類型而不是int和float的混合。
使用Pandas,您可以保留數據的原始“順序”:
pairs = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
df = pd.DataFrame(pairs)
>>> [tup[0] for tup in zip(df.groupby(0, sort=False, as_index=False).sum().values.tolist())]
[[0.5, 7.0], [2.0, 9.6], [7.0, 1.0]]
你可以放棄排序和itertools.groupby
:
from operator import itemgetter
from itertools import groupby
data = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
key = itemgetter(0)
data.sort(key=key) # Use data = sorted(data, key=key) to avoid clobbering
result = [[k, sum(group)] for k, group in groupby(data, key)]
這不會保留密鑰的原始順序。
這會有用嗎?
L = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
nums = []
d = {}
for lst in L:
if lst[0] not in d:
d[lst[0]] = []
nums.append(lst[0])
d[lst[0]].append(lst[1])
for key in nums:
print [key, sum(d[key])]
輸出:
[0.5, 7]
[2, 9.6]
[7, 1]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.