Pandas read_csv 在第一個換行符處結束讀取

Question

我正在嘗試讀取 csv 文件，頂部有一些垃圾，但有趣數據的底部也有垃圾。 我需要讀取多個文件，並且有趣數據的長度各不相同。 有沒有辦法讓pd.read_csv命令知道 dataframe 在第一個換行符處結束？

示例數據（來自 excel 的屏幕截圖）：

我讀了這個文件： dataframe = pd.read_csv(file, skiprows=45)這很好地給了我一個 dataframe 有 10 列，第 46 行的標題（見圖）。 但是，它比#GARBAGE DATA 行更進一步。

重要提示：在我要讀取的不同文件中，數據的長度和頁腳的長度都不相等。

Answer 1

有兩種方法可以實現這個

1）使用讀取csv的skipfooter參數，它告訴function要跳過的文件底部的行數

pd.read_csv("in.csv",skiprows=45,skipfooter=2)

2）按原樣讀取文件，然后使用 dropna function，這應該會刪除垃圾值。

df.dropna(inplace=True)

Answer 2

使用此命令后：

dataframe = pd.read_csv(file, skiprows=45)

你可以使用這個命令：

dataframe= dataframe.dropna(how='any')

如果在該行中找到任何空值，這將刪除該行。 因此它將刪除所有行的 rest。