[英]How to read .log file in python?
我得到了这个.log文件。 我不知道如何将其读取为DataFrame
id | create_date
-----+----------------------------
318 | 2017-05-05 07:03:27.556697
456 | 2017-07-03 01:50:07.966652
249 | 2017-05-03 13:57:32.567373
pd.read_table("data.csv", sep="|", skiprows=[1], header=0, parse_dates=[1]).rename(columns=lambda x: x.strip())
id create_date
0 318 2017-05-05 07:03:27.556697
1 456 2017-07-03 01:50:07.966652
2 249 2017-05-03 13:57:32.567373
sep="|"
使用|
作为列分隔符
skiprows=[1]
忽略第二行,这只是装饰,解析起来最麻烦
header=0
从第一行读取列名
parse_dates=[1]
将create_date
列转换为pandas datetime64
格式(可能是可选的)
rename(columns=lambda x: x.strip())
从列名称中删除多余的空格
如果要将id
列用作索引而不是使用顺序索引,则可能需要添加index_col=0
。
尝试这个,
df=pd.read_csv('file_.csv',sep='|')
那么您可以通过多种方式删除-----+----------------------------
df[df[' id ']!='-----+----------------------------']
df[~df[' id '].str.startswith('-')]
df.drop(0)
#如果您的文件包含-----+----------------------------
在其他任何地方,例如footer
df[df[' create_date '].notnull()]
#当您的create_date列默认包含NaN时,它将不起作用。 输出:
id create_date
1 318 2017-05-05 07:03:27.556697
2 456 2017-07-03 01:50:07.966652
3 249 2017-05-03 13:57:32.567373
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.