繁体   English   中英

带有正则表达式的错误匹配

[英]Erroneous Matches with Regular Expression

$regexp = '/(?:<input\stype="hidden"\sname="){1}([a-zA-Z0-9]*)(?:"\svalue="1"\s\/>)/';
$response = '<input type="hidden" name="7d37dddd0eb2c85b8d394ef36b35f54f" value="1" />';
preg_match($regexp, $response, $matches);

echo $matches[1]; // Outputs: 7d37dddd0eb2c85b8d394ef36b35f54f

因此,我正在使用此正则表达式在实现Joomla的网页上搜索身份验证令牌,以执行脚本化登录。

我已经完成了所有这些工作,但想知道我的正则表达式出了什么问题,因为它总是返回2个项目。

Array ( [0] => [1] => 7d37dddd0eb2c85b8d394ef36b35f54f)

另外,我要检查的输入名称每个页面的长度和名称都会改变。

没有错误。 项目[0]始终包含整个匹配项。 文档 (重点是我的):

如果提供了matches ,则将其填充为搜索结果。 $matches[0]将包含与完整模式匹配的文本$matches[1]将具有与第一个捕获的带括号的子模式 $matches[1]的文本,依此类推。

您的正则表达式(忽略了您首先使用正则表达式来处理HTML的事实,您知道不应该这样做)有点太复杂了。

$regexp = '#<input\s+type="hidden"\s+name="([0-9a-f]*)"\s+value="1"\s*/>#i'
  • 您根本不需要非捕获组。
  • 您使用\\s ,这会将您限制为单个字符。 \\s+可能更好。
  • 使用不同于/东西作为正则表达式边界,使得不必在正则表达式中转义正斜杠。
  • 使正则表达式不区分大小写也可能很有用。
  • auth令牌看起来像一个十六进制字符串,因此不需要匹配az

按照preg_match的手动输入:

如果提供了匹配项,则将其填充为搜索结果。 $ matches [0]将包含与完整模式匹配的文本,$ matches [1]将具有与第一个捕获的带括号的子模式匹配的文本,依此类推。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM