Python list.pop(i) 时间复杂度？

Question

我在网上list.pop()一下，知道list.pop()时间复杂度为 O(1) 但list.pop(i) ) 的时间复杂度为 O(n) 。 当我在编写 leetcode 时，很多人在 for 循环中使用pop(i) ，他们说它的时间复杂度为 O(n)，实际上它比我的代码快，我的代码只使用一个循环，但该循环中有很多行。 我想知道为什么会发生这种情况，我应该使用pop(i)而不是多行来避免它吗？

示例：Leetcode 26. 从排序数组中删除重复项

我的代码：（比 75% 快）

class Solution(object):
    def removeDuplicates(self, nums):
        """
        :type nums: List[int]
        :rtype: int
        """
        left, right = 0, 0
        count = 1
        while right < len(nums)-1:
            if nums[right] == nums[right+1]:
                right += 1
            else:
                nums[left+1]=nums[right+1]
                left += 1
                right += 1
                count += 1
        return count

和其他人的代码，比 90% 快：（这家伙不说 O(n)，但为什么 O(n^2) 比我的 O(n) 快？）

https://leetcode.com/problems/remove-duplicates-from-sorted-array/discuss/477370/python-3%3A-straight-forward-6-lines-solution-90-faster-100-less-memory

我的优化代码（快于 89%）

class Solution(object):
    def removeDuplicates(self, nums):
        """
        :type nums: List[int]
        :rtype: int
        """
        left, right = 0, 0
        while right < len(nums)-1:
            if nums[right] != nums[right+1]:
                nums[left+1]=nums[right+1]
                left += 1
            right += 1
        return left + 1

Answer 1

您的算法确实需要 O(n) 时间，而“逆序弹出”算法确实需要 O(n²) 时间。 然而，LeetCode 并未报告您的时间复杂度优于 89% 的提交； 它报告您的实际运行时间优于所有提交的 89%。 实际运行时间取决于测试算法的输入； 不仅是大小，还有重复的数量。

它还取决于如何平均跨多个测试用例的运行时间； 如果大多数测试用例是针对二次解更快的小输入，那么即使二次解的时间复杂度更高，它也可能整体领先。 @Heap Overflow 在评论中还指出，LeetCode 判断系统的开销时间与算法运行所需的时间成比例地大且变化很大，因此差异可能只是由于该开销的随机变化造成的。

为了阐明这一点，我使用timeit测量了运行时间。 下图显示了我的结果； 考虑到时间复杂性，这些形状正是您所期望的，并且交叉点在我的机器上介于8000 < n < 9000之间。 这是基于排序列表，其中每个不同的元素平均出现两次。 我用来生成时间的代码如下。

计时码：

def linear_solution(nums):
    left, right = 0, 0
    while right < len(nums)-1:
        if nums[right] != nums[right+1]:
            nums[left+1]=nums[right+1]
            left += 1
        right += 1
    return left + 1

def quadratic_solution(nums):
    prev_obj = []
    for i in range(len(nums)-1,-1,-1):
        if prev_obj == nums[i]:
            nums.pop(i)
        prev_obj = nums[i]
    return len(nums)

from random import randint
from timeit import timeit

def gen_list(n):
    max_n = n // 2
    return sorted(randint(0, max_n) for i in range(n))

# I used a step size of 1000 up to 15000, then a step size of 5000 up to 50000
step = 1000
max_n = 15000
reps = 100

print('n', 'linear time (ms)', 'quadratic time (ms)', sep='\t')
for n in range(step, max_n+1, step):
    # generate input lists
    lsts1 = [ gen_list(n) for i in range(reps) ]
    # copy the lists by value, since the algorithms will mutate them
    lsts2 = [ list(g) for g in lsts1 ]
    # use iterators to supply the input lists one-by-one to timeit
    iter1 = iter(lsts1)
    iter2 = iter(lsts2)
    t1 = timeit(lambda: linear_solution(next(iter1)), number=reps)
    t2 = timeit(lambda: quadratic_solution(next(iter2)), number=reps)
    # timeit reports the total time in seconds across all reps
    print(n, 1000*t1/reps, 1000*t2/reps, sep='\t')

结论是，对于足够大的输入，您的算法确实比二次解法快，但是 LeetCode 用来测量运行时间的输入“不够大”，无法克服判断开销的变化，而且平均值包括在二次算法更快的较小输入上测量的时间。

Answer 2

仅仅因为解决方案不是 O(n)，你不能假设它是 O(n^2)。

它并没有完全变成 O(n^2) 因为他以相反的顺序使用 pop 减少了每次弹出的时间，在正向顺序上使用 pop(i) 将比反向使用更多的时间，因为 pop 搜索从反向开始，在每个循环中，他都在减少背面的元素数量。 以非相反的顺序尝试相同的解决方案，运行几次以确保，你会看到。

无论如何，关于为什么他的解决方案更快，你有一个包含很多变量的 if 条件，他只使用了一个变量prev_obj ，使用相反的顺序可以只使用一个变量。 因此，在您的情况下，基本数学运算的数量更多，因此在 O(n) 复杂度相同的情况下，您的每个 n 循环都比他的长。

看看你的计数变量，在每次迭代中，它的值是left+1你可以返回left+1 ，只需删除它就会减少你必须做的 n 数量count=count+1 。

我刚刚发布了这个解决方案，速度提高了 76%

class Solution:
    def removeDuplicates(self, nums: List[int]) -> int:
        a=sorted(set(nums),key=lambda item:item)
        for i,v in enumerate(a):
            nums[i]=v
        return len(a)

而这个速度超过 90% 。

class Solution:
    def removeDuplicates(self, nums: List[int]) -> int:
        a ={k:1 for k in nums} #<--- this is O(n)
        for i,v in enumerate(a.keys()): #<--- this is another O(n), but the length is small so O(m)
            nums[i]=v
        return len(a)

如果您查看 for 循环，您可以说它们都超过 O(n)，但是因为当我循环遍历减少的成员而您的代码循环遍历所有成员时，我们正在使用重复成员。 因此，制作该唯一 set/dict 所需的时间如果少于您遍历这些额外成员并检查 if 条件所需的时间，那么我的解决方案可以更快。

Python list.pop(i) 时间复杂度？

问题描述

2 个解决方案

解决方案1
3 已采纳 2020-01-15 15:07:56

解决方案2
-3 2020-01-15 03:14:56

Python list.pop(i) 时间复杂度？

问题描述

2 个解决方案

解决方案1 3 已采纳 2020-01-15 15:07:56

解决方案2 -3 2020-01-15 03:14:56

解决方案1
3 已采纳 2020-01-15 15:07:56

解决方案2
-3 2020-01-15 03:14:56