python，UnicodeEncodeError，将unicode转换为ascii

Question

首先，我对python很陌生，所以请原谅我所有的n00b内容。 因此，Python中的应用程序逻辑如下所示：

现在的问题是，SQL查询返回了我unicode字符串。 select的输出是这样的：

(u'Abc', u'Lololo', u'Fjordk\xe6r')

因此，首先我尝试将其转换为字符串，但是由于第三个元素包含此德语“ ae”字母，所以它失败了：

for x in data[0]:
    str_data.append(str(x))

我得到：UnicodeEncodeError：'ascii'编解码器无法在位置6编码字符u'\\ xe6'：序数不在范围内（128）

我可以直接插入unicode以在TypeError发生时也插入。 TypeError：强制转换为Unicode：需要字符串或缓冲区，找不到NoneType

有任何想法吗？

Answer 1

根据我的经验，Python和Unicode通常是个问题。

一般来说，如果您有Unicode字符串，则可以将其转换为如下所示的普通字符串：

normal_string = unicode_string.encode('utf-8')

然后将普通字符串转换为Unicode字符串，如下所示：

unicode_string = normal_string.decode('utf-8')

Answer 2

这里的问题是str函数试图使用ascii代码页转换unicode，而ascii代码页没有u\\xe6映射（æ-char参考此处）。

因此，您需要将其转换为支持char的某些代码页。 如今最常用的是utf-8编码。

>>> x = (u'Abc', u'Lololo', u'Fjordk\xe6r')
>>> print x[2].encode("utf8")
Fjordkær
>>> x[2].encode("utf-8")
'Fjordk\xc3\xa6r'

另一方面，您可以尝试将其转换为cp1252-支持它的西方拉丁字母：

>>> x[2].encode("cp1252")
'Fjordk\xe6r'

但是Eeaster欧洲字符集cp1250不支持它：

>>> x[2].encode("cp1250")
...
UnicodeEncodeError: 'charmap' codec can't encode character u'\xe6' in position 6: character maps to <undefined>

python中unicode的问题很常见，我建议如下：