[英]Search for plural words in line and make it singular words
我想查找該行是否包含復數詞。 如果是這樣,我想將這些單詞更改為單數單詞。
例如:
文件1.txt
那個香蕉是黃色的。 它們的味道確實不錯。
Expected_output.txt
那個香蕉是黃色的。 它們的味道確實不錯。
請幫我。
我嘗試使用.re 從單詞中刪除“s”。 但它會刪除文件中的每個“s”。 我只想刪除單詞末尾的's'。 例如,“麻袋”。 我想要“解雇”,但我得到了“確認”。 這是我嘗試過的。
with open('file1.txt') as file1:
file1 = file1.read()
test = re.sub('s', ' ', file1)
with open('file1.txt', 'w') as out:
out.writelines(test)
您基本上有 2 個選項: nltk
庫(更復雜)或 python package 與pattern
。 整潔可能是:
from pattern.text.en import singularize
plurals = ['caresses', 'flies', 'dies', 'mules', 'geese', 'mice', 'bars', 'foos',
'families', 'dogs', 'child', 'wolves']
singles = [singularize(plural) for plural in plurals]
print(singles)
在這里查看更多。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.