将连续的整数组合在一起

Question

有以下代码：

import sys


ints = [1,2,3,4,5,6,8,9,10,11,14,34,14,35,16,18,39,10,29,30,14,26,64,27,48,65]
ints.sort()
ints = list(set(ints))

c = {}

for i,v in enumerate(ints):

    if i+1 >= len(ints):
        continue

    if ints[i+1] == v + 1 or ints[i-1] == v - 1:

        if len(c) == 0:
            c[v] = [v]
            c[v].append(ints[i+1])
        else:
            added=False
            for x,e in c.items():
                last = e[-1]
                if v in e:
                    added=True
                    break

                if v - last == 1:
                    c[x].append(v)
                    added=True

            if added==False:
                c[v] = [v]
    else:
        if v not in c:
            c[v] = [v]



print('input ', ints)
print('output ', c))

目标：

给定一个整数列表，创建一个包含连续整数的字典，以减少列表的总长度。

这是我当前解决方案的输出：

input  [1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 14, 16, 18, 26, 27, 29, 30, 34, 35, 39, 48, 64, 65]
output  {1: [1, 2, 3, 4, 5, 6], 8: [8, 9, 10, 11], 14: [14], 16: [16], 18: [18], 26: [26, 27], 29: [29, 30], 34: [34, 35], 39: [39], 48: [48], 64: [64]}

条件/限制：

如果当前整数是现有列表中的a）或b）是现有列表中的最后一项，我们不希望为此项创建另一个列表。 即在1-5范围内，当我们到达3 ，不要创建列表3,4 ，而是将3附加到现有列表[1,2]

我当前的迭代工作正常，但是由于for x,e in c.items()现有列表检查中的for x,e in c.items()列表越大，它就会指数越慢。

如何在实现相同结果的同时加快速度？

新解决方案（使用19,000个整数的输入列表，从13秒到0.03秒）：

c = {}

i = 0

last_list = None

while i < len(ints):
    cur = ints[i]

    if last_list is None:
        c[cur] = [cur]
        last_list = c[cur]

    else:

        if last_list[-1] == cur-1:
            last_list.append(cur)
        else:
            c[cur] = [cur]
            last_list = c[cur]

    i += 1

Answer 1

由于你有连续数字的列表，我建议你使用range对象而不是list s：

d, head = {}, None
for x in l:
    if head is None or x != d[head].stop:
        head = x
    d[head] = range(head, x+1)

Answer 2

如果您使用for循环并且只是跟踪当前列表，解决方案很简单。 当您发现差距时，不要忘记制作新的清单：

result = {}
cl = None
for i in ints:
    if cl is None or i - 1 != cl[-1]:
        cl = result.setdefault(i, [])
    cl.append(i)

Answer 3

有一个很棒的库叫做more_itertools ，它有一个名为： consecutive_groups() ：

import more_itertools as mit
x = [1,2,3,4,5,6,8,9,10,11,14,34,14,35,16,18,39,10,29,30,14,26,64,27,48,65]
x = [list(j) for j in mit.consecutive_groups(sorted(list(set(x))))]
# [[1, 2, 3, 4, 5, 6], [8, 9, 10, 11], [14], [16], [18], [26, 27], [29, 30], [34, 35], [39], [48], [64, 65]]
dct_x = {i[0]: i for i in x}
print(dct_x)

输出：

{1: [1, 2, 3, 4, 5, 6], 8: [8, 9, 10, 11], 14: [14], 16: [16], 18: [18], 26: [26, 27], 29: [29, 30], 34: [34, 35], 39: [39], 48: [48], 64: [64, 65]}

还有一个注释，您希望在转换为集合之后进行排序，因为集合是无序的。

Answer 4

可以用O(n) （线性）复杂度来解决这个任务。 保持简单：

integers = [1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 14, 16, 18, 26, 27, 29, 30, 34, 35, 39, 48, 64, 65]

helper = []
counter = 0
while counter < len(integers):
  if not helper or helper[-1] + 1 != integers[counter]:
    print('gap found', integers[counter])  # do your logic
  helper.append(integers[counter])
  counter += 1

上面的算法假定输入列表已经排序。 它给了我们巨大的优势。 同时，在运行此算法之前，可以明确地对整数列表进行排序。 然后，解的总复杂度为： O(n * log n) + O(n) ，其有效地为O(n * log n) 。 O(n * log n)是排序过程的复杂性。

我建议记住这个非常有用的技巧，即在接近未来用途的任务之前使用排序。

Answer 5

这是一个简单的实现，使用列表切片实现您的目标：

integers = [1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 14, 16, 18, 26, 27, 29, 30, 34, 35, 39, 48, 64, 65]
for i, integer in enumerate(integers):
    if i == 0:
        out_dict = {}
        start = 0
    else:
        if integer != prev_integer + 1:
            out_dict[integers[start]] = integers[start:i]
            start = i
        if i == len(integers) - 1:
            out_dict[integers[start]] = integers[start:]
    prev_integer = integer

>>>out_dict =  {1: [1, 2, 3, 4, 5, 6], 8: [8, 9, 10, 11], 14: [14], 16: [16], 18: [18], 26: [26, 27], 29: [29, 30], 34: [34, 35], 39: [39], 48: [48], 64: [64]}

注意：字典可能不会按升序键排序，因为dict类型没有排序。

Answer 6

您可以尝试使用itertools，但我想尝试递归：

input_dta=[1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 14, 16, 18, 26, 27, 29, 30, 34, 35, 39, 48, 64, 65]

final_=[]

def consecutives(data):
    sub_final=[]

    if not data:
        return 0
    else:
        for i,j in enumerate(data):
            try:

                if abs(data[i]-data[i+1])==1:
                    sub_final.extend([data[i],data[i+1]])



                else:
                    if sub_final:
                        final_.append(set(sub_final))




                    return consecutives(data[i+1:])
            except IndexError:
                pass

    final_.append(set(sub_final))


consecutives(input_dta)



print(final_)

输出：

[{1, 2, 3, 4, 5, 6}, {8, 9, 10, 11}, {26, 27}, {29, 30}, {34, 35}, {64, 65}]

将连续的整数组合在一起

问题描述

6 个解决方案

解决方案1
3 已采纳 2018-04-12 05:11:05

解决方案2
2 2018-04-12 04:59:17

解决方案3
1 2018-04-12 04:23:28

解决方案4
0 2018-04-12 04:17:32

解决方案5
0 2018-04-12 04:56:05

解决方案6
0 2018-04-12 05:50:09

将连续的整数组合在一起

问题描述

6 个解决方案

解决方案1 3 已采纳 2018-04-12 05:11:05

解决方案2 2 2018-04-12 04:59:17

解决方案3 1 2018-04-12 04:23:28

解决方案4 0 2018-04-12 04:17:32

解决方案5 0 2018-04-12 04:56:05

解决方案6 0 2018-04-12 05:50:09

解决方案1
3 已采纳 2018-04-12 05:11:05

解决方案2
2 2018-04-12 04:59:17

解决方案3
1 2018-04-12 04:23:28

解决方案4
0 2018-04-12 04:17:32

解决方案5
0 2018-04-12 04:56:05

解决方案6
0 2018-04-12 05:50:09