[英]How to read correctly Japanese characters from a file without (escape sequences) “\ufeff” and “\u3000” values in strings?
我有下一個日語文本,我必須用它們的行('\\n')在字符串中分隔。 文本稱為“sonnet.txt”
さよなら夜の教室
一旦我打開文件並將文本拆分為一組行。
file = open('sonnet.txt', encoding="utf-8")
jP = file.read().split('\n')
我在列表的 python 提示中得到了下一個結果。
>>> jP
['\ufeffさよなら\u3000夜の教室',]
有沒有辦法擺脫“\”和“\ ”部分,不是為了這個存儲的值,而是為了其他類型的詞? 謝謝你。
其實我寫了你的代碼並制作了sonnet.txt
文本文件,但我沒有得到同樣的結果。
我的輸出是: ['さよなら夜の教室']
順便說一句,我建議這樣做:
file = open('sonnet.txt', encoding="utf-8")
jP = file.read().replace('\ufeff', '').replace('\u3000', '').split('\n')
print(jP)
更多信息:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.