[英]Regular expression for <a> tag replacement
我是正则表达式的新手,但我正在尝试学习它。 我想删除html文本的标记,而只保留内部文本。 像这样:
Original: Lorem ipsum <a href="http://www.google.es">Google</a> Lorem ipsum <a href="http://www.bing.com">Bing</a>
Result: Lorem ipsum Google Lorem ipsum Bing
我正在使用此代码:
$patterns = array( "/(<a href=\"[a-z0-9.:_\-\/]{1,}\">)/i", "/<\/a>/i");
$replacements = array("", "");
$text = 'Lorem ipsum <a href="http://www.google.es">Google</a> Lorem ipsum <a href="http://www.bing.com">Bing</a>';
$text = preg_replace($patterns,$replacements,$text);
它可以工作,但是我不知道这段代码是更有效还是更易读。
我可以通过某种方式改进代码吗?
在您的情况下,PHP的strip_tags()
应该可以完全满足您的需要,而无需使用正则表达式。 如果您只想剥离特定标签(默认情况下, strip_tags()
不能执行此操作),则User Contributed Notes中有一个功能。
通常,正则表达式不适合解析HTML。 最好使用诸如Simple HTML DOM之类的DOM解析器或PHP的内置解析器之一 。
如果您的内容仅包含锚标记,则strip_tags可能更易于使用。
如果a和href之间有多余的空格,或者标签中包含其他任何属性,则不会替换您的preg_replace。
在这种情况下,使用正则表达式不是一个好主意。 话说回来:
<?php
$text = 'Lorem ipsum <a href="http://www.google.es">Google</a> Lorem ipsum <a href="http://www.bing.com">Bing</a>';
$text = preg_replace(
'@\\<a\\b[^\\>]*\\>(.*?)\\<\\/a\\b[^\\>]*\\>@',
'\\1',
$text
);
echo $text;
// Lorem ipsum Google Lorem ipsum Bing
?>
这是一个非常琐碎的正则表达式,不是证明。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.