繁体   English   中英

如何修复 TypeError:无法连接类型为 &#39; 的对象<class 'pandas.io.parsers.TextFileReader'> &#39;; 只有 Series 和 DataFrame 对象有效吗?

[英]How to fix TypeError: cannot concatenate object of type '<class 'pandas.io.parsers.TextFileReader'>'; only Series and DataFrame objs are valid?

我正在尝试读取 csv 文件并将它们连接起来并将它们作为一个 csv 文件输出。 我不断收到此错误:

类型错误:无法连接类型为 '< class 'pandas.io.parsers.TextFileReader'>' 的对象; 只有 Series 和 DataFrame 对象有效;

我不知道如何解决它。 我是初学者,所以我很感激任何帮助! 谢谢! 这是我写的代码:

csv.field_size_limit(sys.maxsize)
df1 = pd.read_csv('file1.csv', chunksize=20000)
df2 = pd.read_csv('file2.csv', chunksize=20000)
df3 = pd.read_csv('file3.csv', chunksize=20000)
df4 = pd.read_csv('file4.csv', chunksize=20000)
df5 = pd.read_csv('file5.csv', chunksize=20000)
df6 = pd.read_csv('file6.csv', chunksize=20000)

frames = [df1, df2, df3, df4, df5, df6]
result = pd.concat(frames, ignore_index=True, sort=False)
result.to_csv('new.csv')

如果您调用read_csv传递chunksize参数,则:

  • 它返回一个TextFileReader对象,
  • 它可以用于,例如在循环中,读取和处理连续的块。

如何使用“分块”CSV 文件读取的示例:

reader = pd.read_csv('input.csv', chunksize=20000)
for chunk in reader:
    # Process the chunk (DataFrame)

或者,您可能想要:

  • 从每个源文件中读取最初的 20000 行
  • 将它们连接成一个新的 DataFrame?

如果是这种情况,请在读取每个文件时传递nrows=20000 (而不是chunksize )。 然后,所有返回的对象将只是DataFrames,你将能够Concat的他们。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM