如何修复 TypeError：无法连接类型为 ' 的对象<class 'pandas.io.parsers.TextFileReader'> '; 只有 Series 和 DataFrame 对象有效吗？

Question

我正在尝试读取 csv 文件并将它们连接起来并将它们作为一个 csv 文件输出。 我不断收到此错误：

类型错误：无法连接类型为 '< class 'pandas.io.parsers.TextFileReader'>' 的对象； 只有 Series 和 DataFrame 对象有效；

我不知道如何解决它。 我是初学者，所以我很感激任何帮助！ 谢谢！ 这是我写的代码：

csv.field_size_limit(sys.maxsize)
df1 = pd.read_csv('file1.csv', chunksize=20000)
df2 = pd.read_csv('file2.csv', chunksize=20000)
df3 = pd.read_csv('file3.csv', chunksize=20000)
df4 = pd.read_csv('file4.csv', chunksize=20000)
df5 = pd.read_csv('file5.csv', chunksize=20000)
df6 = pd.read_csv('file6.csv', chunksize=20000)

frames = [df1, df2, df3, df4, df5, df6]
result = pd.concat(frames, ignore_index=True, sort=False)
result.to_csv('new.csv')

Answer 1

如果您调用read_csv传递chunksize参数，则：

它返回一个TextFileReader对象，
它可以用于，例如在循环中，读取和处理连续的块。

如何使用“分块”CSV 文件读取的示例：

reader = pd.read_csv('input.csv', chunksize=20000)
for chunk in reader:
    # Process the chunk (DataFrame)

或者，您可能想要：

从每个源文件中只读取最初的 20000 行，
将它们连接成一个新的 DataFrame？

如果是这种情况，请在读取每个文件时传递nrows=20000 （而不是chunksize ）。 然后，所有返回的对象将只是DataFrames，你将能够Concat的他们。

如何修复 TypeError：无法连接类型为 ' 的对象<class 'pandas.io.parsers.TextFileReader'> '; 只有 Series 和 DataFrame 对象有效吗？

问题描述

1 个解决方案

解决方案1
0 2020-02-01 17:04:40

如何修复 TypeError：无法连接类型为 &#39; 的对象<class 'pandas.io.parsers.TextFileReader'> &#39;; 只有 Series 和 DataFrame 对象有效吗？

问题描述

1 个解决方案

解决方案1 0 2020-02-01 17:04:40

如何修复 TypeError：无法连接类型为 ' 的对象<class 'pandas.io.parsers.TextFileReader'> '; 只有 Series 和 DataFrame 对象有效吗？

解决方案1
0 2020-02-01 17:04:40