繁体   English   中英

如何在python中读取.log文件?

[英]How to read .log file in python?

我得到了这个.log文件。 我不知道如何将其读取为DataFrame

 id  |        create_date         
-----+----------------------------
 318 | 2017-05-05 07:03:27.556697
 456 | 2017-07-03 01:50:07.966652
 249 | 2017-05-03 13:57:32.567373
pd.read_table("data.csv", sep="|", skiprows=[1], header=0, parse_dates=[1]).rename(columns=lambda x: x.strip())

    id                create_date
0  318 2017-05-05 07:03:27.556697
1  456 2017-07-03 01:50:07.966652
2  249 2017-05-03 13:57:32.567373

参量

  • sep="|"

    使用| 作为列分隔符

  • skiprows=[1]

    忽略第二行,这只是装饰,解析起来最麻烦

  • header=0

    从第一行读取列名

  • parse_dates=[1]

    create_date列转换为pandas datetime64格式(可能是可选的)

  • rename(columns=lambda x: x.strip())

    从列名称中删除多余的空格

如果要将id列用作索引而不是使用顺序索引,则可能需要添加index_col=0

尝试这个,

df=pd.read_csv('file_.csv',sep='|')

那么您可以通过多种方式删除-----+----------------------------

  1. df[df[' id ']!='-----+----------------------------']
  2. df[~df[' id '].str.startswith('-')]
  3. df.drop(0) #如果您的文件包含-----+----------------------------在其他任何地方,例如footer
  4. df[df[' create_date '].notnull()] #当您的create_date列默认包含NaN时,它将不起作用。

输出:

    id           create_date         
1   318    2017-05-05 07:03:27.556697
2   456    2017-07-03 01:50:07.966652
3   249    2017-05-03 13:57:32.567373

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM