[英]Searching for words that are composed entirely from a list of root words
我一般是編碼新手,我認為現在是自學一些 Python 的好時機。
我目前正在嘗試實現的是確定一個單詞列表,這些單詞完全由我將選擇的一組可變的根詞、音節、前綴和后綴組成。
到目前為止,這就是我的目標;
from nltk.corpus import words as english
vocab = set(w.lower() for w in english.words())
syllables = ('in', 'con', 'sis', 'tent', 'tant', 'si', 'ate', 'der', 'ing', 'a', 'c', 't')
syl_set=set(syllables)
for word in vocab:
if all(x in syl_set for x in set(word)):
print (word)
在下載了單詞語料庫的 NLTK 安裝的幫助下,我能夠搜索英文單詞列表和 output 由我的音節列表(如上所示)中的單個字母組成的單詞列表,例如 cat,tact .
然而,這並不是 output 由超過一個字母的字符串組成的單詞,例如一致的、體貼的。
有人可以解釋為什么這些多字母字符串不被用來查找他們可以拼出的單詞嗎? 此外,任何有關如何解決此問題的建議將不勝感激。
謝謝,馬庫斯
好吧,原因是您只是在尋找單個字符。 看看這部分: for x in set(word)
。 這一個遍歷word
中包含的所有字符集中的所有字母。
看看結果來自
[x for x in set(word)]
看看我的意思。
解決這個問題可能很棘手。 將單詞拆分成音節比拆分成字符更難。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.