为什么这个正则表达式不起作用？

Question

1.txt的内容：

Image" href="images/product_images/original_images/9961_1.jpg" rel="disable-zoom:false; disable-expand: false"><img src="im

无效的代码：

<?php
$pattern = '/(images\/product_images\/original_images\/)(.*)(\.jpg)/i';
$result = file_get_contents("1.txt");
preg_match($pattern,$result,$match);

echo "<h3>Preg_match Pattern test:</h3><br><br><pre>";
print_r($match);
echo "</pre>";
?>

我期望这个结果：

Array
(
    [0] => images/product_images/original_images/9961_1.jpg
    [1] => images/product_images/original_images/
    [2] => 9961_1
    [3] => .jpg
)

但我喜欢这样：

Array
(
    [0] => images/product_images/original_images/9961_1.jpg" rel="disable-zoom:false; disable-expand: false"> 
    [1] => images/product_images/original_images/
    [2] => 9961_1.jpg" rel="disable-zoom:false; disable-expand: false"> 
)

我厌倦了尝试使用此正则表达式的上百万种组合。 我不知道怎么了 请，并非常感谢！

Answer 1

使其不贪心：

$pattern = '/(images\/product_images\/original_images\/)(.*?)(\.jpg)/i';

Answer 2

请记住，正则表达式是贪婪的。 您的第二个捕获(.*)表示匹配换行以外的任何字符（除非在多行模式下）。 因此，它可能正在捕获其余部分。

您可以按照Wrikken的建议将其设置为不满意 。 但是我想确保自己捕捉到了想要的东西。 就您而言，它看起来像href属性的值。 因此，实际上我想要至少一个字符，不能为引号，后跟jpg扩展名：

$pattern = '/(images\/product_images\/original_images\/)([^'"]+)(\.jpg)/i';

Answer 3

这是基本的正则表达式：

href="((.*/)(.*?)(.jpg))"

Answer 4

不要用正则表达式解析HTML。

为什么这个正则表达式不起作用？

问题描述

4 个解决方案

解决方案1
4 已采纳 2010-09-17 01:44:26

解决方案2
2 2010-09-17 01:48:27

解决方案3
0 2010-09-17 01:53:53

解决方案4
-1 2010-09-17 02:20:40

为什么这个正则表达式不起作用？

问题描述

4 个解决方案

解决方案1 4 已采纳 2010-09-17 01:44:26

解决方案2 2 2010-09-17 01:48:27

解决方案3 0 2010-09-17 01:53:53

解决方案4 -1 2010-09-17 02:20:40

解决方案1
4 已采纳 2010-09-17 01:44:26

解决方案2
2 2010-09-17 01:48:27

解决方案3
0 2010-09-17 01:53:53

解决方案4
-1 2010-09-17 02:20:40