无法在Pandas Python中打开CSV文件

Question

我运行了以下脚本（ https://github.com/FXCMAPI/FXCMTickData/blob/master/TickData34.py ），并在末尾添加了以下几行以下载文件：

    output_folder = '/Users/me/Documents/data/forex/'
    target_folder = os.path.join(output_folder, symbol, year)
    os.makedirs(target_folder, exist_ok=True)
    with open(os.path.join(target_folder, str(i) + '.csv'), 'wb') as outfile:
            outfile.write(data)

然后，我尝试使用pandas打开文件，如下所示：

x = pd.read_csv('/Users/me/Documents/data/forex/EURUSD/2015/29.csv')

但是，这就是我得到的：

    In [3]: x.info()
    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 2415632 entries, 0 to 2415631
    Data columns (total 3 columns):
    D             float64
    Unnamed: 1    float64
    Unnamed: 2    float64
    dtypes: float64(3)
    memory usage: 55.3 MB

    In [4]: x.dropna()
    Out[4]: 
    Empty DataFrame
    Columns: [D, Unnamed: 1, Unnamed: 2]
    Index: []

为什么数据框为空？

如果我在TextEdit上打开文件，则前几行实际上是这样的：

DateTime,Bid,Ask

07/19/2015 21:00:15.469,1.083,1.08332

07/19/2015 21:00:16.949,1.08311,1.08332

07/19/2015 21:00:16.955,1.08311,1.08338

Answer 1

显然，数据中的每个字符后跟一个空字符\\x00 。 摆脱它们，一切都会起作用：

outfile.write(data.replace(b'\x00',b''))

Answer 2

感谢您提供一个非常具体且可重现的问题。

我粘贴了您的代码并在Windows中运行它们，实际上它只读取了55MB的空值。

但是我认为这是熊猫无法正确解析csv文件的问题，而不是它无法打开csv文件。

但是，在尝试了此答案中列出的所有编码后，它只是没有产生效果，因此文件也可能有问题。

我最终如何使它工作的方法是在excel中打开并将其另存为其他文件，然后熊猫可以正确解析它。

无法在Pandas Python中打开CSV文件

问题描述

2 个解决方案

解决方案1
1 已采纳 2017-10-13 05:09:22

解决方案2
0 2017-10-13 03:21:02

无法在Pandas Python中打开CSV文件

问题描述

2 个解决方案

解决方案1 1 已采纳 2017-10-13 05:09:22

解决方案2 0 2017-10-13 03:21:02

解决方案1
1 已采纳 2017-10-13 05:09:22

解决方案2
0 2017-10-13 03:21:02