繁体 English 中英

Python：如何解析字符串中的非ASCII字符

[英]Python: how to parse non-ASCII characters in string

原文 2019-05-29 18:17:20 6 1 python/ encoding/ character-encoding/ python-unicode

在我的Python脚本中，我试图读取一个文本文件，其中包含带有人名和姓的列，其中一些列有非ASCII字符，如ñ 。 但是当我这样做时，我得到错误UnicodeDecodeError: 'utf8' codec can't decode byte 0x96 in position 66 。

从我在网上阅读的内容来看，我知道你可以通过忽略或删除非ASCII字符来处理这个问题，但我不想这样做。 是否有直接的方法将文件中的所有非ASCII字符转换为普通字符串？

目前，我正在使用infile = open(filename, 'rU')打开我的文件。

不重复的问题 ：我问的是如何读取带有unicode字符的文件，而不是如何将unicode字符串写入文件。

1 个解决方案

制作文件的副本。
确保您的文件是unicode，并找出它使用的unicode格式。 像geany这样的简单编辑器可以帮助您找到在创建文件时使用的正确编码。 拆分文件，如果它很大并由编辑处理它的一部分。
使用正确的编码（可能是旧的cp编码）打开文件并将文件转换为utf8。 或者使用工具（如编辑器）将其转换为utf8

如何在Python中打印非ASCII字符

[英]How to print non-ASCII characters in Python

Python非ASCII字符

[英]Python non-ascii characters

如何使用 BeautifulSoup 解析具有非 ASCII 字符的 HTML？

[英]How to Parse HTML with Non-ASCII Characters using BeautifulSoup?

当字符串中包含非ASCII字符时，如何将C字符串（char数组）转换为Python字符串？

[英]How to convert a C string (char array) into a Python string when there are non-ASCII characters in the string?

使用python / django从字符串中删除非ASCII字符

[英]Remove non-ASCII characters from a string using python / django

从字符串 Python 中删除非 ascii 和特殊字符

[英]Remove non-ascii and special characters from a string Python

在 python 3 中无法读取带有非 ascii 字符的字符串

[英]Trouble reading string with non-ascii characters in python 3

如何在视图中拆分包含非ASCII字符的字符串？

[英]How to split string containing non-ascii characters in views?

如何按空格拆分字符串并删除非 ASCII 字符？

[英]How to split a string by spaces and remove non-ASCII characters?

如何让python解释器正确处理字符串操作中的非ASCII字符？

[英]How to make the python interpreter correctly handle non-ASCII characters in string operations?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在Python中打印非ASCII字符 Python非ASCII字符如何使用 BeautifulSoup 解析具有非 ASCII 字符的 HTML？当字符串中包含非ASCII字符时，如何将C字符串（char数组）转换为Python字符串？使用python / django从字符串中删除非ASCII字符从字符串 Python 中删除非 ascii 和特殊字符在 python 3 中无法读取带有非 ascii 字符的字符串如何在视图中拆分包含非ASCII字符的字符串？如何按空格拆分字符串并删除非 ASCII 字符？如何让python解释器正确处理字符串操作中的非ASCII字符？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM