[英]Pandas “read_sql” UnicodeDecodeError
我使用pandas
从Vertica DataBase中读取:
pd.read_sql(query, self._conn)
但它失败了
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 1: invalid continuation byte
。
其他查询不会失败,因此问题出在此查询的某个特定列中。
我需要所有数据 - 我该怎么办? 我也可以在Vertica中进行更改,但我无法更改表值...
PS这就是我为Vertica创建连接的方法:
conn_info = url2vertica(url)
conn_info["read_timeout"] = 2400
conn_info["ssl"] = False
vrt = vertica_python.connect(**conn_info)
实际上,我来到这个解决方案:在sql-query中使用isUTF8()
。
同样在这里 ,在UTF-8编码问题中,我们可以通过'unicode_error': 'ignore'
忽略错误'unicode_error': 'ignore'
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.