繁体   English   中英

如何删除文本文件中的非ASCII字符?

[英]How to delete non-ASCII characters in a text file?

我有这个.log文件,我将扩展名更改为.txt文件,但它仍作为日志文件读取

在此处输入图片说明

但是,在我将其复制并粘贴到新的编辑器并将其保存为.txt文件后,它显示如下:

在此处输入图片说明

有人告诉我这是我应该删除的非ASCII字符。 有什么办法可以删除它或复制日志文件的内容,然后使用python将其放置在文本文件中?

在Python中,您可以指定输入编码。

with open('trendx.log', 'r', encoding='utf-16le') as reader, \
     open('trendx.txt', 'w') as writer:
   for line in reader:
        if "ROW" in line:
           writer.write(line)

我显然已经复制了您先前问题中的一些内容。 最终确定实际问题的荣誉。

请特别注意我们如何避免将整个文件读入内存,而是一次处理一行。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM