用字符串中的單詞替換單詞

Question

我有如下字典

word_dict = {'a': 'a1', 'winter': 'cold', 'summer': 'hot'}

我有一個像這樣的字符串：

data = "It's winter not summer. Have a nice day"

我想要做的是在data中將a by a1替換為a by a1 ，將winter by cold替換為winter by cold 。 我確實嘗試使用以下代碼：

for word in word_dict:
    data = data.replace(word, word_dict[word])

但是它失敗了，因為它替換了子字符串（ data的子字符串，而不是單詞）。 實際上，“ Have ”一詞被Ha1ve取代。

結果應為：

data = "It's cold not hot. Have a1 nice day"

Answer 1

您可以使用re.sub 。 \\b單詞字符和非單詞字符之間匹配的單詞邊界。 我們需要使用單詞邊界來匹配確切的單詞字符串，否則，它也會匹配day的a

>>> word_dict = {'a': 'a1', 'winter': 'cold', 'summer': 'hot'}
>>> data = "It's winter not summer. Have a nice day"
>>> for word in word_dict:
        data = re.sub(r'\b'+word+r'\b', word_dict[word], data)


>>> data
"It's cold not hot. Have a1 nice day"

Answer 2

除了正則表達式外，還有多種方法可以實現此目的：

ldata = data.split(' ') #splits by whitespace characters
res = []
for i in ldata:
    if i in word_dict:
        res.append(word_dict[i])
    else:
        res.append(i)
final = ' '.join(res)

正則表達式解決方案更實用，並且可以滿足您的需要，但是list.split（）和string.join（）方法有時會派上用場。 :)

Answer 3

使用帶有dict.get和分裂分裂的" "以保持正確的間距：

from string import punctuation

print(" ".join([word_dict.get(x.rstrip(punctuation), x) for x in data.split(" ")]))
It's cold not hot. Have a1 nice day

summer.我們還需要刪除標點符號summer. 匹配summer等...

一些時間表明，即使拆分和剝離非正則表達式方法，其速度仍然是原來的兩倍：

In [18]: %%timeit                                                              data = "It's winter not summer. Have a nice day"
for word in word_dict:
        data = re.sub(r'\b'+word+r'\b', word_dict[word], data)
   ....: 
100000 loops, best of 3: 12.2 µs per loop

In [19]: timeit " ".join([word_dict.get(x.rstrip(punctuation), x) for x in data.split(" ")])
100000 loops, best of 3: 5.52 µs per loop

Answer 4

您可以在join()函數內使用生成器：

>>> word_dict = {'a': 'a1', 'winter': 'cold', 'summer': 'hot'}
>>> data = "It's winter not summer. Have a nice day"
>>> ' '.join(word_dict[j] if j in word_dict else j for j in data.split())
"It's cold not summer. Have a1 nice day"

通過分割數據，您可以搜索其單詞，然后使用簡單的理解來替換特定的單詞。

用字符串中的單詞替換單詞

問題描述

4 個解決方案

解決方案1
4 已采納 2015-02-06 10:40:01

解決方案2
1 2015-02-06 10:46:37

解決方案3
1 2015-02-06 10:54:09

解決方案4
0 2015-02-06 10:54:03

用字符串中的單詞替換單詞

問題描述

4 個解決方案

解決方案1 4 已采納 2015-02-06 10:40:01

解決方案2 1 2015-02-06 10:46:37

解決方案3 1 2015-02-06 10:54:09

解決方案4 0 2015-02-06 10:54:03

解決方案1
4 已采納 2015-02-06 10:40:01

解決方案2
1 2015-02-06 10:46:37

解決方案3
1 2015-02-06 10:54:09

解決方案4
0 2015-02-06 10:54:03