为什么count（）方法比for循环python更快

Question

这里有两个完全相同的函数，但有谁知道为什么使用count()方法比另一个快得多？ （我的意思是它是如何工作的？它是如何构建的？）

如果可能的话，我想要一个比这里找到的更容易理解的答案：用于实现Python str.count函数的算法或源代码中的内容： https ： //hg.python.org/cpython/file/tip/Objects /stringlib/fastsearch.h

def scoring1(seq):
    score = 0
    for i in range(len(seq)):
       if seq[i] == '0':
           score += 1      
    return score

def scoring2(seq):
    score = 0
    score = seq.count('0') 
    return score

seq = 'AATTGGCCGGGGAG0CTTC0CTCC000TTTCCCCGGAAA'
# takes 1min15 when applied to 100 sequences larger than 100 000 characters
score1  = scoring1(seq)
# takes 10 sec when applied to 100 sequences larger than 100 000 characters
score2  = scoring2(seq)

非常感谢您的回复

Answer 1

因为count是在底层本机实现中执行的。 for循环以较慢的解释代码执行。

Answer 2

@CodeMonkey已经给出了答案，但可能有趣的是要注意你的第一个函数可以改进，以便运行速度提高20％：

import time, random

def scoring1(seq):
    score=0
    for i in range(len(seq)):
       if seq[i]=='0':
           score+=1      
    return score

def scoring2(seq):
    score=0
    for x in seq:
       score += (x =='0')    
    return score

def scoring3(seq):
    score = 0
    score = seq.count('0') 
    return score

def test(n):
    seq = ''.join(random.choice(['0','1']) for i in range(n))
    functions = [scoring1,scoring2,scoring3]
    for i,f in enumerate(functions):
        start = time.clock()
        s = f(seq)
        elapsed = time.clock() - start
        print('scoring' + str(i+1) + ': ' + str(s) + ' computed in ' + str(elapsed) + ' seconds')

test(10**7)

典型输出：

scoring1: 5000742 computed in 0.9651326495293333 seconds
scoring2: 5000742 computed in 0.7998054195159483 seconds
scoring3: 5000742 computed in 0.03732172598339578 seconds

前两种方法都被内置的count() 。

故事的道德：当您没有使用已经优化的内置方法时，您需要优化自己的代码。

为什么count（）方法比for循环python更快

问题描述

2 个解决方案

解决方案1
4 2016-12-06 12:39:25

解决方案2
3 已采纳 2016-12-06 12:58:32

为什么count（）方法比for循环python更快

问题描述

2 个解决方案

解决方案1 4 2016-12-06 12:39:25

解决方案2 3 已采纳 2016-12-06 12:58:32

解决方案1
4 2016-12-06 12:39:25

解决方案2
3 已采纳 2016-12-06 12:58:32