簡體   English   中英

Pandas read_csv 在第一個換行符處結束讀取

[英]Pandas read_csv end reading at first linebreak

我正在嘗試讀取 csv 文件,頂部有一些垃圾,但有趣數據的底部也有垃圾。 我需要讀取多個文件,並且有趣數據的長度各不相同。 有沒有辦法讓pd.read_csv命令知道 dataframe 在第一個換行符處結束?

示例數據(來自 excel 的屏幕截圖): 示例數據

我讀了這個文件: dataframe = pd.read_csv(file, skiprows=45)這很好地給了我一個 dataframe 有 10 列,第 46 行的標題(見圖)。 但是,它比#GARBAGE DATA 行更進一步。

重要提示:在我要讀取的不同文件中,數據的長度和頁腳的長度都不相等。

有兩種方法可以實現這個

1)使用讀取csv的skipfooter參數,它告訴function要跳過的文件底部的行數

pd.read_csv("in.csv",skiprows=45,skipfooter=2)

2)按原樣讀取文件,然后使用 dropna function,這應該會刪除垃圾值。

df.dropna(inplace=True)

使用此命令后:

dataframe = pd.read_csv(file, skiprows=45)

你可以使用這個命令:

dataframe= dataframe.dropna(how='any')

如果在該行中找到任何空值,這將刪除該行。 因此它將刪除所有行的 rest。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM