簡體   English   中英

如何從沒有(轉義序列)字符串中的“\”和“\ ”值的文件中正確讀取日語字符?

[英]How to read correctly Japanese characters from a file without (escape sequences) “\ufeff” and “\u3000” values in strings?

我有下一個日語文本,我必須用它們的行('\\n')在字符串中分隔。 文本稱為“sonnet.txt”

さよなら夜の教室

一旦我打開文件並將文本拆分為一組行。

file = open('sonnet.txt', encoding="utf-8")
jP = file.read().split('\n')

我在列表的 python 提示中得到了下一個結果。

>>> jP
['\ufeffさよなら\u3000夜の教室',]

有沒有辦法擺脫“\”和“\ ”部分,不是為了這個存儲的值,而是為了其他類型的詞? 謝謝你。

其實我寫了你的代碼並制作了sonnet.txt文本文件,但我沒有得到同樣的結果。

我的輸出是: ['さよなら夜の教室']

順便說一句,我建議這樣做:

file = open('sonnet.txt', encoding="utf-8")
jP = file.read().replace('\ufeff', '').replace('\u3000', '').split('\n')
print(jP)

更多信息:

消除“\ ”錯誤

Unicode 字符 'IDEOGRAPHIC SPACE' (U+3000)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM