Python：基于连续的相同值将列表拆分为索引

Question

如果您可以建议我如何编写脚本以按值数目拆分列表，我的意思是：

my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20]

并且有11-4,12-2,15-6,20-3个项目。 因此，在下一个示例范围（0：100）的列表中，我必须分割4,2,6,3个部分，因此我为分割列表计算了相同的值和功能，但不适用于列表：

 div=Counter(my_list).values() ##counts same values in the list

 def chunk(it, size):
    it = iter(it)
    return iter(lambda: tuple(islice(it, size)), ())

我需要什么：

Out: ([0,1,2,3],[4,5],[6,7,8,9,10,11], etc...]

Answer 1

您可以使用enumerate ， itertools.groupby和operator.itemgetter ：

In [45]: import itertools

In [46]: import operator

In [47]: [[e[0] for e in d[1]] for d in itertools.groupby(enumerate(my_list), key=operator.itemgetter(1))]
Out[47]: [[0, 1, 2, 3], [4, 5], [6, 7, 8, 9, 10, 11], [12, 13, 14]]

其作用如下：

首先，它枚举项目。
它使用每个枚举元组中的第二项（原始值）对它们进行分组。
在每个组的结果列表中，它使用每个元组中的第一项（枚举）

Answer 2

Python 3中的解决方案，如果仅使用counter ：

from collections import Counter
my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20] 
count = Counter(my_list)
div= list(count.keys())         # take only keys
div.sort()
l = []
num = 0
for i in div:
    t = []
    for j in range(count[i]):   # loop number of times it occurs in the list
        t.append(num)
        num+=1
    l.append(t)
print(l)

输出：

[[0, 1, 2, 3], [4, 5], [6, 7, 8, 9, 10, 11], [12, 13, 14]]

使用set替代解决方案：

my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20] 
val = set(my_list)                     # filter only unique elements
ans = []
num = 0
for i in val:
    temp = []
    for j in range(my_list.count(i)):   # loop till number of occurrence of each unique element
        temp.append(num)
        num+=1
    ans.append(temp)
print(ans)

编辑：根据所需的更改以获取所需的输出，如@Protoss Reed在评论中所述

my_list =[11,11,11,11,12,12,15,15,15,15,15,15,20,20,20] 
val = list(set(my_list))                     # filter only unique elements
val.sort()                                   # because set is not sorted by default
ans = []
index = 0
l2 = [54,21,12,45,78,41,235,7,10,4,1,1,897,5,79]
for i in val:
    temp = []
    for j in range(my_list.count(i)):   # loop till number of occurrence of each unique element
        temp.append(l2[index])
        index+=1
    ans.append(temp)
print(ans)

输出：

[[54, 21, 12, 45], [78, 41], [235, 7, 10, 4, 1, 1], [897, 5, 79]]

在这里，我必须将set转换为list因为set没有排序，我认为剩下的是不言而喻的。

如果输入不总是Sorted（使用OrderedDict ），则另一个解决方案 ：

from collections import OrderedDict
v = OrderedDict({})
my_list=[12,12,11,11,11,11,20,20,20,15,15,15,15,15,15]
l2 = [54,21,12,45,78,41,235,7,10,4,1,1,897,5,79]
for i in my_list:                # maintain count in dict
    if i in v:
        v[i]+=1
    else:
        v[i]=1
ans =[]
index = 0
for key,values in v.items():
    temp = []
    for j in range(values):
        temp.append(l2[index])
        index+=1
    ans.append(temp)
print(ans)

输出：

[[54, 21], [12, 45, 78, 41], [235, 7, 10], [4, 1, 1, 897, 5, 79]]

在这里，我使用OrderedDict来维护输入序列的顺序，在set情况下该顺序是随机的（不可预测的）。

虽然我更喜欢@Ami Tavory的解决方案，但它更像pythonic。

[额外工作：如果有人可以将此解决方案转换为list comprehension那将很棒，因为我尝试了但无法将其转换为list comprehension ，如果成功，请在评论中发布它，这将有助于我理解。]

Python：基于连续的相同值将列表拆分为索引

问题描述

2 个解决方案

解决方案1
3 2016-09-12 12:49:14

解决方案2
1 已采纳 2016-09-12 13:55:12

Python：基于连续的相同值将列表拆分为索引

问题描述

2 个解决方案

解决方案1 3 2016-09-12 12:49:14

解决方案2 1 已采纳 2016-09-12 13:55:12

解决方案1
3 2016-09-12 12:49:14

解决方案2
1 已采纳 2016-09-12 13:55:12