[英]Ruby Regex for Common Log Format
大家好,我正在尋找一個正則表達式,它將“解析” Common Log Format標准的一行並從中提供7個變量:
有人已經實現了此正則表達式嗎?
輸入:
127.0.0.1 user-identifier frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326
正則表達式:
(\S+)\s+(\S+)\s+(\S+)\s+(\[.*?\])\s+(".*?")\s+(\S+)\s+(\S+)
捕獲組的編號如以下細分所示。
分解:
Group Regex Match
#1 IP (\S+) 127.0.0.1
#2 Identity (\S+) user-identifier
#3 Username (\S+) frank
#4 Time (\[.*?\]) [10/Oct/2000:13:55:36 -0700]
#5 Request (".*?") "GET /apache_pb.gif HTTP/1.0"
#6 Status (\S+) 200
#7 Size (\S+) 2326
each separated by a \s+
我只是先獲取時間並提出要求,然后這只是一個簡單的拆分:
a = '127.0.0.1 user-identifier frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326'
time = a.slice!(/\[.*?\]/)
request = a.slice!(/".*"/)
ip, identity, username, status, size = a.split
我還想出了自己的正則表達式,它也拆分了動詞,uri和HTTP版本。
^([\d\.]*)\s([\w|-]*)\s([\w|-]*)\s\[(.*)\]\s\"([\w]*)\s(.*)\s(.*)\"\s([\d]*)\s([\d]*)$
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.