繁体   English   中英

使用Pandas在Python中导入CSV时出错

[英]Error while importing csv in Python using pandas

我已经开始学习用于数据科学的Python。 我几乎每天都在使用R。 我第一步。 我尝试使用Pandas read_csv文件方法导入csv文件。 我在导入时对文件进行编码有问题。

如果我从R使用read.csv,一切正常:

df <- read.csv2("some_path/myfile.txt", stringsAsFactors = FALSE, encoding = 'UTF-8')

但是如果我在python中使用类似的代码:

import pandas as pd
df = pd.read_csv("some_path/myfile.txt", sep = ';', encoding= 'utf8')

它返回一个错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 13: invalid continuation byte

我怎么可能在R中以“ utf-8”编码导入文件,而在Python中却不能?

如果我使用其他编码(latin1或iso-8859-1),它将成功导入文件,但是字符编码方式不正确。

即使我不明白为什么UTF-8可以在R中运行而不能在Python中运行,我仍然发现cp1250编码可以正常工作。

使用编码“ UTF-16”。 我用它来解决我的问题,出现同样的错误。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM