[英]Python: split list into indices based on consecutive identical values
如果您可以建议我如何编写脚本以按值数目拆分列表,我的意思是:
my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20]
并且有11-4,12-2,15-6,20-3个项目。 因此,在下一个示例范围(0:100)的列表中,我必须分割4,2,6,3个部分,因此我为分割列表计算了相同的值和功能,但不适用于列表:
div=Counter(my_list).values() ##counts same values in the list
def chunk(it, size):
it = iter(it)
return iter(lambda: tuple(islice(it, size)), ())
我需要什么:
Out: ([0,1,2,3],[4,5],[6,7,8,9,10,11], etc...]
您可以使用enumerate
, itertools.groupby
和operator.itemgetter
:
In [45]: import itertools
In [46]: import operator
In [47]: [[e[0] for e in d[1]] for d in itertools.groupby(enumerate(my_list), key=operator.itemgetter(1))]
Out[47]: [[0, 1, 2, 3], [4, 5], [6, 7, 8, 9, 10, 11], [12, 13, 14]]
其作用如下:
首先,它枚举项目。
它使用每个枚举元组中的第二项(原始值)对它们进行分组。
在每个组的结果列表中,它使用每个元组中的第一项(枚举)
Python 3中的解决方案,如果仅使用counter
:
from collections import Counter
my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20]
count = Counter(my_list)
div= list(count.keys()) # take only keys
div.sort()
l = []
num = 0
for i in div:
t = []
for j in range(count[i]): # loop number of times it occurs in the list
t.append(num)
num+=1
l.append(t)
print(l)
输出:
[[0, 1, 2, 3], [4, 5], [6, 7, 8, 9, 10, 11], [12, 13, 14]]
使用set
替代解决方案:
my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20]
val = set(my_list) # filter only unique elements
ans = []
num = 0
for i in val:
temp = []
for j in range(my_list.count(i)): # loop till number of occurrence of each unique element
temp.append(num)
num+=1
ans.append(temp)
print(ans)
编辑:根据所需的更改以获取所需的输出,如@Protoss Reed在评论中所述
my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20]
val = list(set(my_list)) # filter only unique elements
val.sort() # because set is not sorted by default
ans = []
index = 0
l2 = [54,21,12,45,78,41,235,7,10,4,1,1,897,5,79]
for i in val:
temp = []
for j in range(my_list.count(i)): # loop till number of occurrence of each unique element
temp.append(l2[index])
index+=1
ans.append(temp)
print(ans)
输出:
[[54, 21, 12, 45], [78, 41], [235, 7, 10, 4, 1, 1], [897, 5, 79]]
在这里,我必须将set
转换为list
因为set
没有排序,我认为剩下的是不言而喻的。
如果输入不总是Sorted(使用OrderedDict
),则另一个解决方案 :
from collections import OrderedDict
v = OrderedDict({})
my_list=[12,12,11,11,11,11,20,20,20,15,15,15,15,15,15]
l2 = [54,21,12,45,78,41,235,7,10,4,1,1,897,5,79]
for i in my_list: # maintain count in dict
if i in v:
v[i]+=1
else:
v[i]=1
ans =[]
index = 0
for key,values in v.items():
temp = []
for j in range(values):
temp.append(l2[index])
index+=1
ans.append(temp)
print(ans)
输出:
[[54, 21], [12, 45, 78, 41], [235, 7, 10], [4, 1, 1, 897, 5, 79]]
在这里,我使用OrderedDict
来维护输入序列的顺序,在set
情况下该顺序是随机的(不可预测的)。
虽然我更喜欢@Ami Tavory的解决方案,但它更像pythonic。
[额外工作:如果有人可以将此解决方案转换为list comprehension
那将很棒,因为我尝试了但无法将其转换为list comprehension
,如果成功,请在评论中发布它,这将有助于我理解。]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.