[英]Get href value with DOMDocument in PHP
在file_get_contents
之后,我收到了這個 HTML:
<h1>
<a href="blablabla.html">Manhattan Skyline</a>
</h1>
我只想得到blablabla.html
部分。
如何使用 PHP 中的DOMDocument
功能解析它?
重要提示:我收到的 HTML 包含多個<a href="...">
。
我嘗試的是:
$page = file_get_contents('https://...');
$dom = new DOMDocument();
$dom->loadHTML($page);
$xp = new DOMXpath($dom);
$url = $xp->query('h1//a[@href=""]');
$url = $url->item(0)->getAttribute('href');
謝謝你的幫助。
h1//a[@href=""]
正在尋找一個帶有href
屬性的a
元素,其值為空字符串,而您的href
屬性包含的值不是空字符串。
如果這是整個文檔,那么您可以使用表達式//a
。
否則, h1//a
也應該可以工作。
如果您要求a
元素具有任何值的href
屬性,則可以使用h1//a[@href]
。
如果h1
不在文檔的根目錄,您可能希望使用//h1
代替。 所以最后一個例子會變成//h1//a[@href]
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.