繁体   English   中英

检测列表中连续的相同值

[英]Detect consecutive identical values in list

我有一个组织成列表字典的数据集,例如:

{ UUID: [3, 3, 5, 3, 0, 0, 3, 3, 2, 3, 2, 1, 1, 0, 2, 0, 5, 0, 0, 0, 0, 3, 4, 1, 2], 
  UUID: [1, 2, 3, 1, 0, 0, 2] }

我想检测连续相同值(尤其是0)的情况,尤其是检测n个连续相同值的实例。

例如,如果n为3且值为0,我会将第一个key:value对的UUID附加到合格UUID列表中,而不是第二个。

以这种方式检测连续相同值的最有效方法是什么?

使用itertools.groupby来检测连续数字的运行:

uuids = { 'a': [3, 3, 5, 3, 0, 0, 3, 3, 2, 3, 2, 1, 1, 0, 2, 0, 5, 0, 0, 0, 0, 3, 4, 1, 2], 
  'b': [1, 2, 3, 1, 0, 0, 2]}

from itertools import groupby 

def detect_runs_in_dict(d, n=3):
    return [uuid for uuid, val in d.items() #in python 2, use .iteritems
        if any(len(list(g)) >= n for k,g in groupby(val))]

演示

detect_runs_in_dict(uuids)
Out[28]: ['a']

detect_runs_in_dict(uuids,n=2)
Out[29]: ['a', 'b']

这并不能区分“运行”中可以包含哪个值-如果要指定它,可以直接添加:

def detect_runs_in_dict(d, n=3, searchval=0):
    return [uuid for uuid, val in d.items() 
        if any(k == searchval and len(list(g)) >= n for k,g in groupby(val))]

您可以使用itertools.groupby通过以下方式获取给定值的最大连续出现次数:

max(
  filter(
    lambda gr:gr[0]==0,
    groupby(_list)
  ), key=lambda gr:len(list(gr[1]))
)

您可以将len(list())重新应用到结果的第二个参数,或者您可以简单地调整过滤器以消除连续时间短于预期的结果。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM