如何查找字符串中单词的字符出现的总数？

Question

我是Python的新手，我想在字符串中找到一个子字符串。

例如，如果我有一些常量字母的子字符串，例如：

substring = 'sdkj'

还有一些字母的字符串，例如：

string = 'sdjskjhdvsnea'

我想做一个计数器，以便在字符串中找到的任何字母S ， D ， K和J都将递增1。例如，对于上述示例，计数器将为8 。

我该如何实现？

Answer 1

也许这段代码可以帮助您：

>>> string = 'sdjskjhdvsnea'
>>> substring = 'sdkj'
>>> counter = 0
>>> for x in string:
...     if x in substring:
...         counter += 1


>>> counter
8
>>>

Answer 2

编辑：

当你这样做显然是希望整个四字的出场数substring ，正则表达式可能是最简单的方法：

>>> import re
>>> string = 'sdkjhsgshfsdkj'
>>> substring = 'sdkj'
>>> len(re.findall(substring, string))
2

re.findall会给你的所有（非重叠）出场名单substring的string ：

>>> re.findall('sdkj', 'sdkjhsgshfsdkj')
['sdkj', 'sdkj']

通常， “查找子字符串'sdkj' ”将意味着尝试在较大的string找到完整的四字符substring的外观。 在这种情况下，您似乎只是想要这四个字母的总和：

sum(string.count(c) for c in substring)

或者，更有效地使用collections.Counter ：

from collections import Counter

counts = Counter(string)
sum(counts.get(c, 0) for c in substring)

这只会在string迭代一次，而不是对子string中的每个c in substring迭代一次，因此O(m+n)而不是O(m*n) （其中m == len(string)和n == len(substring) ）。

实际上：

>>> string = "sdjskjhdvsnea"
>>> substring = "sdkj"
>>> sum(string.count(c) for c in substring)
8
>>> from collections import Counter
>>> counts = Counter(string)
>>> sum(counts.get(c, 0) for c in substring)
8

请注意，您可能希望set(substring)避免重复计算：

>>> sum(string.count(c) for c in "sdjks")
11
>>> sum(string.count(c) for c in set("sdjks"))
8

Answer 3

使用re.findall()的替代解决方案：

>>> import re
>>> substring = 'sdkj'
>>> string = 'sdjskjhdvsnea'
>>> len(re.findall('|'.join(list(substring)), string))
8

如何查找字符串中单词的字符出现的总数？

问题描述

3 个解决方案

解决方案1
2 已采纳 2014-06-22 11:29:39

解决方案2
1 2014-06-22 11:32:48

解决方案3
1 2014-06-22 11:36:42

如何查找字符串中单词的字符出现的总数？

问题描述

3 个解决方案

解决方案1 2 已采纳 2014-06-22 11:29:39

解决方案2 1 2014-06-22 11:32:48

解决方案3 1 2014-06-22 11:36:42

解决方案1
2 已采纳 2014-06-22 11:29:39

解决方案2
1 2014-06-22 11:32:48

解决方案3
1 2014-06-22 11:36:42