使用python使用pandas读取文本文件

Question

我对 Python 很陌生。 我正在尝试使用 python 数据科学库 Pandas 读取我的文本文件。 但是我收到了一个我不明白的 Unicode 错误。如果你能帮助我，那对我来说非常有益。 我在这里上传我的代码：

import pandas as pd
text = pd.read_csv("/home/system/Documents/Heena/NLP/modi.txt", sep = " ", header = None)

错误代码：

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/system/anaconda3/lib/python3.7/site-packages/pandas/io/parsers.py", line 678, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "/home/system/anaconda3/lib/python3.7/site-packages/pandas/io/parsers.py", line 446, in _read
    data = parser.read(nrows)
  File "/home/system/anaconda3/lib/python3.7/site-packages/pandas/io/parsers.py", line 1036, in read
    ret = self._engine.read(nrows)
  File "/home/system/anaconda3/lib/python3.7/site-packages/pandas/io/parsers.py", line 1848, in read
    data = self._reader.read(nrows)
  File "pandas/_libs/parsers.pyx", line 876, in pandas._libs.parsers.TextReader.read
  File "pandas/_libs/parsers.pyx", line 891, in pandas._libs.parsers.TextReader._read_low_memory
  File "pandas/_libs/parsers.pyx", line 945, in pandas._libs.parsers.TextReader._read_rows
  File "pandas/_libs/parsers.pyx", line 932, in pandas._libs.parsers.TextReader._tokenize_rows
  File "pandas/_libs/parsers.pyx", line 2112, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 62 fields in line 7, saw 67

Answer 1

由于空格字符内的数据，CVS 将其视为不同的列。 作为解决方案，将数据与不同的字符分开。 然后将 sep 值设为这个字符。 例子;

测试文件

data1;data2;data3
My dear countrymen;12;test data1
I convey my best wishes to all of you on this auspicious occasion of Independence Day.;45;test data2

测试文件

import pandas as pd
text = pd.read_csv("test.csv", sep = ";")

你也可以看看这个答案

使用python使用pandas读取文本文件

问题描述

1 个解决方案

解决方案1
0 2018-12-25 15:43:17

测试文件

测试文件

使用python使用pandas读取文本文件

问题描述

1 个解决方案

解决方案1 0 2018-12-25 15:43:17

测试文件

测试文件

解决方案1
0 2018-12-25 15:43:17