Pandas read_csv 在第一个换行符处结束读取

Question

我正在尝试读取 csv 文件，顶部有一些垃圾，但有趣数据的底部也有垃圾。 我需要读取多个文件，并且有趣数据的长度各不相同。 有没有办法让pd.read_csv命令知道 dataframe 在第一个换行符处结束？

示例数据（来自 excel 的屏幕截图）：

我读了这个文件： dataframe = pd.read_csv(file, skiprows=45)这很好地给了我一个 dataframe 有 10 列，第 46 行的标题（见图）。 但是，它比#GARBAGE DATA 行更进一步。

重要提示：在我要读取的不同文件中，数据的长度和页脚的长度都不相等。

Answer 1

有两种方法可以实现这个

1）使用读取csv的skipfooter参数，它告诉function要跳过的文件底部的行数

pd.read_csv("in.csv",skiprows=45,skipfooter=2)

2）按原样读取文件，然后使用 dropna function，这应该会删除垃圾值。

df.dropna(inplace=True)

Answer 2

使用此命令后：

dataframe = pd.read_csv(file, skiprows=45)

你可以使用这个命令：

dataframe= dataframe.dropna(how='any')

如果在该行中找到任何空值，这将删除该行。 因此它将删除所有行的 rest。