用于捕获Curl HTTP状态代码和主体响应的正则表达式

Question

我试图创建一个捕获HTTP状态代码以及curl请求主体的正则表达式。 下面的正则表达式模式可在多个在线站点上运行，但在Mac的命令行上的shell if语句中无法匹配。 我的正则表达式关闭了吗？

RESPONSE=$(curl -s -i -X GET http://www.google.com/)

# Match and capture the status code, match the headers, match two new lines, match and capture an optional body
re="^HTTP\/\d\.\d\s([\d]{3})[\w\d\s\W\D\S]*[\r\n]{2}([\w\d\s\W\D\S]*)?$"

if [[ "${RESPONSE}" =~ $re ]]; then
  echo "match"
  # Now do stuff with the captured groups, "${BASH_REMATCH[...]}"
else
  echo "no match"
fi

我也乐于接受其他方法（我的目标是运行CentOS 5的计算机）。

Answer 1

与@delarsschneider的想法相同，稍微复杂一点

RESPONSE=$(curl -s -i -X GET http://www.google.com/)

CODE=$(echo $RESPONSE | sed -n 's/HTTP.* \(.*\) .*/\1/p')

BODY=$(echo $RESPONSE | tr '\n' ' ' | sed -n 's/.*GMT *\(.*\)/\1/p')

echo $CODE
echo $BODY

Answer 2

由于您也可以使用其他解决方案，因此可以尝试一下。

RESPONSE=$(curl -s -i -X GET http://www.google.com/)

HTTP_STATUS_CODE=`echo $RESPONSE | sed '
  /HTTP/ { 
    s/^HTTP[^ ]* //
    s/ .*$//
    q
  }
  D'`

BODY=`echo $RESPONSE | sed '
  /^.$/ {
    :body
    n
    b body
  }
  D'`

echo $HTTP_STATUS_CODE
echo $BODY

在以HTTP开头的第一行中找到HTTP_STATUS_CODE 。 删除第一个空格之前的每个非空格，并从结果（找到“ 302找到”）中删除从第一个空格到行尾的所有内容。

BODY从与单个字符匹配的第一行开始（之前的行用'D'删除）。 从这里开始打印每一行，直到输入结束。

用于捕获Curl HTTP状态代码和主体响应的正则表达式

问题描述

2 个解决方案

解决方案1
3 2016-04-13 16:00:53

解决方案2
2 已采纳 2016-04-13 13:28:59

用于捕获Curl HTTP状态代码和主体响应的正则表达式

问题描述

2 个解决方案

解决方案1 3 2016-04-13 16:00:53

解决方案2 2 已采纳 2016-04-13 13:28:59

解决方案1
3 2016-04-13 16:00:53

解决方案2
2 已采纳 2016-04-13 13:28:59