字符串集之間的區別不起作用

Question

首先，感謝您的幫助，我幾天來一直試圖解決此問題。

檔案myStopWords.txt：

è
ad
più
a
b
c
17

我的代碼：

stopWord = set(open("<...>/myStopwords.txt").read().split("\n"))
oldWords = set(["a","b","ad", "è", "più","17","horse"])

print( oldWords.difference(stopWord) )

結果：

{'horse', 'ad', 'più', 'è'}

為什么不從set減去"ad" ， "è" ， "più" ？

結果應為{horse} 。

Answer 1

謝謝。 如先前評論中所建議，這是解決方案：

1）將文本文件轉換為UTF-8。

2）

fname = '<...>/myStopwords.txt'

with open(fname, encoding='utf-8') as f:
    content = f.readlines()

stopWord = [x.strip() for x in content] 


oldWords = set(["a","b","ad", "è", "più","17","horse"])
print( oldWords.difference(stopWord) )

字符串集之間的區別不起作用

問題描述

1 個解決方案

解決方案1
0 2018-09-10 15:33:23

字符串集之間的區別不起作用

問題描述

1 個解決方案

解決方案1 0 2018-09-10 15:33:23

解決方案1
0 2018-09-10 15:33:23