解析日志文件

Question

我正在嘗試從日志文件中解析這樣的文本：

[2016-01-29 11：31：33,809：WARNING / Worker-1283] 1030140 ::: DEAL_OF_DAY ::: 29 ::: 1 ::: 11 [2016-01-29 11：31：34,103：WARNING / Worker -1197] 1025311 :::: DEAL_OF_DAY ::: 29 ::: 1 ::: 11 [2016-01-29 11：31：34,291：警告/工人1197] 1025158 ::: DEAL_OF_DAY ::: 29 :::: 1 ::: 11

我想提取這些數字1030140、1025311、1025158等。

我嘗試了以下

cat deals29.txt | egrep -o '[0-9]+'

但這也給了其他數字

我試過了
cat deals29.txt | egrep -o ' [0-9]+:::'

但是現在它在輸出中也提供了冒號，並且無法在grep的命令行版本中捕獲該組。

有什么建議么？ grep解決方案將是首選，但如果grep無法勝任，我也可以使用sed / awk。

Answer 1

使用grep -oP並匹配reset \\K ：

grep -oP '^\[.*?\] \K\d+' file.log
1030140
1025311
1025158

如果您的grep不支持-P （PCRE），請使用awk ：

awk -F '\\] |:::' '{print $2}' file.log
1030140
1025311
1025158

Answer 2

您可以在這里訓練regex： https ： //regex101.com/

我懂了

] [0-9]*

而且您必須刪除前兩個字符

Answer 3

您可以使用類似的解決方案：

(\d{3,})::
# looks for at least 3 digits (or more) followed by two colons
# puts the matched numbers in group 1

在此處查看此方法的演示。

解析日志文件

問題描述

3 個解決方案

解決方案1
2 已采納 2016-02-01 11:59:35

解決方案2
0 2016-02-01 11:59:32

解決方案3
0 2016-02-01 13:57:02

解析日志文件

問題描述

3 個解決方案

解決方案1 2 已采納 2016-02-01 11:59:35

解決方案2 0 2016-02-01 11:59:32

解決方案3 0 2016-02-01 13:57:02

解決方案1
2 已采納 2016-02-01 11:59:35

解決方案2
0 2016-02-01 11:59:32

解決方案3
0 2016-02-01 13:57:02