簡體   English   中英

如何使用Python從文本文件讀取unicode並將相應的字符串寫入exel文件

[英]How to read unicode from text file and write respective string into exel file by using Python

我有一個文件,其中包含日語中的Unicode字符,我想從文件中讀取Unicode並將相應的非Unicode字符(字符串)寫入另一個文件。

文件中的Unicode如下所示:

\u6C0F\u540D 
\u7BA1\u7406\u8005\u540D
\u4F4F\u6240
\u96FB\u8A71\u756A\u53F7
\u30E1\u30FC\u30EB\u30A2\u30C9\u30EC\u30B9

實際上,我想從此Unicode生成一個Excel文件,該文件由上述Unicode的非Unicode字符組成。

如果您有一個名為japanese.txt的文件,其內容如下:

\u6C0F\u540D 
\u7BA1\u7406\u8005\u540D
\u4F4F\u6240
\u96FB\u8A71\u756A\u53F7
\u30E1\u30FC\u30EB\u30A2\u30C9\u30EC\u30B9

您可以使用以下代碼使用openpyxl將其添加到Excel文件中:

# -*- coding: utf-8 -*-

from openpyxl import Workbook
import codecs

with codecs.open('japanese.txt', 'r', encoding='utf8') as file:
    s = file.read()

s = s.decode('unicode-escape')

wb = Workbook()

ws = wb.active

ws['A1'] = 42

ws.append([1, 2, 3])

import datetime
ws['A2'] = s

wb.save("sample.xlsx")

似乎有一個名為unidecode的軟件包可以為您服務 它將很容易做到這一點。 例如:

>>> from unidecode import unidecode
>>> print(unidecode(u"\u6C0F\u540D"))
Shi Ming

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM