[英]more efficient use of itertools.groupby()
我正在努力增强我对itertools
库的了解,因为它通常很有用。 为此,我试图解决我遇到的一个采访益智游戏。 其中很大一部分涉及顺序计算一个数字内的分组和重复数字的数量。 例如,对于数字:
1223444556
我想要:
[(1,1),(2,2),(1,3),(3,4),(2,5),(1,6)]
也就是说,从左到右,有1个,2个,2个,1个,等等。
这是我目前的代码:
from itertools import groupby
groups_first = [int(''.join(v)[0]) for k,v in groupby(str(1223444556))]
counts = [len(''.join(v)) for k,v in groupby(str(1223444556))]
zip(counts,groups_first)
它有效,但我想知道的是,是否有一种更紧凑的方式来绕过两个列表。 有什么想法吗? 我想这可能会在groupby()中做一些lambda函数,但我还没看到它。
谢谢!
我可能只是写
>>> n = 1223444556
>>> [(len(list(g)), int(k)) for k,g in groupby(str(n))]
[(1, 1), (2, 2), (1, 3), (3, 4), (2, 5), (1, 6)]
怎么样:
[(sum(1 for _ in v), int(k)) for k,v in groupby(str(1223444556))]
我可能会选择收藏:
>>> from collections import Counter
>>> c = Counter('1223444556')
>>> c.items()
[('1', 1), ('3', 1), ('2', 2), ('5', 2), ('4', 3), ('6', 1)]
如果订单很重要(正如您在评论中所说),这可能不再是最有效的方法。 但要充分考虑,你可以这样做:
>>> t = c.items()
>>> t = sorted(t)
如果你想要y,x被列为x,y,你可以这样做:
>>> t = [(y, x) for x, y in t]
>>> print t
[(1, '1'), (2, '2'), (1, '3'), (3, '4'), (2, '5'), (1, '6')]
此方法的一个值是重复元素被列为字符串,因此不会混淆哪个数字来自原始列表,哪个数字表示频率。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.