查找字符串中相同相鄰字符的數量

Question

我有一個字符串：'AAAAATTT'

我想編寫一個程序，每當2個值相同時就進行計數。 因此，在“ AAAAATTT”中，其計數為：

AA：4 TT：2

Answer 1

您可以為此使用collections.defaultdict 。 這是O（n）復雜度解決方案，它遍歷相鄰字母並根據條件構建字典。

您的輸出將是一個字典，其中的鍵是重復的字母，而值是計數。

使用itertools.islice是為了避免為zip的第二個參數構建新列表。

from collections import defaultdict
from itertools import islice

x = 'AAAAATTT'

d = defaultdict(int)

for i, j in zip(x, islice(x, 1, None)):
    if i == j:
        d[i+j] += 1

結果：

print(d)

defaultdict(<class 'int'>, {'AA': 4, 'TT': 2}

Answer 2

您可以使用Counter ：

from collections import Counter

s = 'AAAAATTT'
print([(k*2, v - 1) for k, v in Counter(list(s)).items() if v > 1])

#output: [('AA', 4), ('TT', 2)]

Answer 3

您可以將具有字典理解和zip collections.Counter用作：

>>> from collections import Counter
>>> s = 'AAAAATTT'

>>> {k: v for k, v in Counter(zip(s, s[1:])).items() if k[0]==k[1]}
{('A', 'A'): 4, ('T', 'T'): 2}

這是使用itertools.groupby實現此目的的另一種方法，但是它不如上述解決方案那么干凈（在性能方面也會很慢） 。

>>> from itertools import groupby

>>> {x[0]:len(x) for i,j in groupby(zip(s, s[1:]), lambda y: y[0]==y[1]) for x in (tuple(j),) if i}
{('A', 'A'): 4, ('T', 'T'): 2}

Answer 4

一種方法可以如下使用Counter ：

from collections import Counter
string = 'AAAAATTT'
result = dict(Counter(s1+s2 for s1, s2 in zip(string, string[1:]) if s1==s2))
print(result)

結果：

{'AA': 4, 'TT': 2}

Answer 5

您可以使用range方法嘗試它，而無需導入任何東西：

data='AAAAATTT'
count_dict={}
for i in range(0,len(data),1):
    data_x=data[i:i+2]
    if len(data_x)>1:
        if data_x[0] == data_x[1]:

            if data_x not in count_dict:
                count_dict[data_x] = 1
            else:
                count_dict[data_x] += 1



print(count_dict)

輸出：

{'TT': 2, 'AA': 4}

查找字符串中相同相鄰字符的數量

問題描述

5 個解決方案

解決方案1
2 2018-04-14 23:02:34

解決方案2
0 2018-04-14 23:03:24

解決方案3
0 2018-04-14 23:10:22

解決方案4
0 2018-04-14 23:40:32

解決方案5
0 2018-04-15 04:14:46

查找字符串中相同相鄰字符的數量

問題描述

5 個解決方案

解決方案1 2 2018-04-14 23:02:34

解決方案2 0 2018-04-14 23:03:24

解決方案3 0 2018-04-14 23:10:22

解決方案4 0 2018-04-14 23:40:32

解決方案5 0 2018-04-15 04:14:46

解決方案1
2 2018-04-14 23:02:34

解決方案2
0 2018-04-14 23:03:24

解決方案3
0 2018-04-14 23:10:22

解決方案4
0 2018-04-14 23:40:32

解決方案5
0 2018-04-15 04:14:46