[英]Python Pandas: Skip rows by particular pattern (not row number) using pd.read_csv
我正在尝试将csv文件导入Pandas DataFrame。 但是,这是一个挑战,例如,我不能使用skiprows = 9 ,因为csv格式有时会不一致,因此在实际表开始之前它将包含一些无用的信息。
幸运的是,在表开始之前,总会有一行带有字符串“ report field”的行,然后实际表将从下一行开始。
有什么办法可以跳过所有行,直到捕获到“报告字段”模式?
谢谢。
df= pandas.read_csv("file.csv",header= None)
df_2= df.iloc[(df.loc[df[0]=='report field'].index[0]+1):, :].reset_index(drop = True)
因此,上一行在“ df”数据帧的“ 0”列中搜索“报告字段”值,然后从“ file.csv”文件的下一行到最后一行中提取数据
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.