正则表达式从文本中获取所有href标签

Question

我的文字很大，其中包含普通文字和href标签。 我想使用正则表达式检索所有href标签。

我尝试了href="([^"]*)"但它仅返回一个href值。

 $result[] = $util->execute(self::$queryToGetContentFromPagesEng3); //getting text from database
 foreach ($result as $temp) {
   if(preg_match("href=\"([^\"]*)\"",$temp)) {
     $storeUrl []=$temp;
   }
 }

我需要这样的结果：

href=/public/coursecontent/2017-08-03-12-bhnhlwdjzyblelskiard.docx
href=/public/coursecontent/2016-07-07-07-rncsuatxhkkbeomysbmk.docx

Answer 1

我的第一点是，在这种情况下，正则表达式很可能不是您要采用的路径。

但是继续进行下去，您可以尝试使用preg_match_all而不是preg_match来查找多个匹配项并将它们存储在数组中，然后从您的foreach中运行一个preg_match_all并将其存储在数组中，并将array_merge合并到$storeUrul数组中。

但是，我相信一种更简单的方法，最有可能也是更可靠的方法是解析HTML并从DOM中进行工作。 这是一个简短的指南，可以根据您的情况简化为：

$dom = new DOMDocument();
$dom->loadHTML($result);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("a");

for($i = 0; $i < $hrefs->length; $i++){
    $href = $hrefs->item($i);
    $url = $href->getAttribute('href');
    $storeUrl[] = $url;
}

Answer 2

由于标题是js正则表达式...

 const myString = '...'
 const regex = /href=".+?"/gi;
 const regex2 = /(?<=href=").+?(?=")/gi;
 //regex2 is without 'href' and "
 myString.match(regex);

正则表达式从文本中获取所有href标签

问题描述

2 个解决方案

解决方案1
3 2019-07-26 21:46:35

解决方案2
0 2019-07-26 21:52:57

正则表达式从文本中获取所有href标签

问题描述

2 个解决方案

解决方案1 3 2019-07-26 21:46:35

解决方案2 0 2019-07-26 21:52:57

解决方案1
3 2019-07-26 21:46:35

解决方案2
0 2019-07-26 21:52:57