簡體   English   中英

將字符串轉換為utf-16

[英]Convert string to utf-16

我有一個帶有日語字符的文本文件。 我從中讀取了一行,並希望將其專門轉換為utf-16。 如何使用Python做到這一點? 我的代碼看起來像這樣-

with open("C:\\Users\\badri\\jap.txt", 'rb') as f:
    for line in f:
        u = line.decode(encoding='utf-16',errors='strict')

我收到此錯誤“ LookupError:未知編碼:utf-16”

原因是我希望在utf-16中使用它是因為單詞之間用空格隔開,所以文本文件所使用的語言無關緊要。我將能夠使用空格作為分隔符並計算文件中單詞的數量。

分離后,我可以輕松地以這種方式打印它們-

u1 = u'\u0048\u0065\u006c\u006c\u006f'
u2 = u'\u0077\u006f\u0072\u006c\u0064'
u3 = u'\u3053\u3093\u306b\u3061\u306f\u4e16\u754c'
print u1
print u2
print u3

Hello
world
こんにちは世界

這完全取決於文件的編碼。

無論哪種方式,您都需要先解碼該行,然后再對其進行編碼,以使其為utf-16。

with open(file_path, "r") as fh:
    for line in fh:
        string = line.decode("utf-8").encode("utf-16")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM