繁体   English   中英

Pandas read_csv 在第一个换行符处结束读取

[英]Pandas read_csv end reading at first linebreak

我正在尝试读取 csv 文件,顶部有一些垃圾,但有趣数据的底部也有垃圾。 我需要读取多个文件,并且有趣数据的长度各不相同。 有没有办法让pd.read_csv命令知道 dataframe 在第一个换行符处结束?

示例数据(来自 excel 的屏幕截图): 示例数据

我读了这个文件: dataframe = pd.read_csv(file, skiprows=45)这很好地给了我一个 dataframe 有 10 列,第 46 行的标题(见图)。 但是,它比#GARBAGE DATA 行更进一步。

重要提示:在我要读取的不同文件中,数据的长度和页脚的长度都不相等。

有两种方法可以实现这个

1)使用读取csv的skipfooter参数,它告诉function要跳过的文件底部的行数

pd.read_csv("in.csv",skiprows=45,skipfooter=2)

2)按原样读取文件,然后使用 dropna function,这应该会删除垃圾值。

df.dropna(inplace=True)

使用此命令后:

dataframe = pd.read_csv(file, skiprows=45)

你可以使用这个命令:

dataframe= dataframe.dropna(how='any')

如果在该行中找到任何空值,这将删除该行。 因此它将删除所有行的 rest。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM