簡體   English   中英

我想使用php搜尋器從此文檔中獲取特定的網址

[英]I want to get specific urls from this document using a php crawler

我不知道該怎么辦,我可能會得到一些反對。

我有一個與此類似的網頁:

<li class="specific-class">
    <a href="http://unknown-url.com">Unknown Link</a>
</li>

我想抓取一個頁面,其中填充了我對檢索不感興趣的其他幾個元素。

我只想在li元素內的anchor標記中檢索href屬性,而別無其他。 之后,我將點擊鏈接並獲得另一個具有以下內容的網頁:

<h1 class="specific-class">Blah Blah Blah</h1>

因此,最后,我將獲得h1元素中的所有內容:

Blah Blah Blah

如果你們能幫助我解決這個問題,我將不勝感激。 另外,任何API都會做的很好。

我有這段代碼從一個元素獲取屬性,但是我無法獲取它來對特定元素中找到的元素進行爬網。

<?php
include_once('simple_html_dom.php');
$target_url = "https://www.google.com/";
$html = new simple_html_dom();
$html->load_file($target_url);
foreach($html->find('a') as $link){
     echo $link->href."<br>";

}

?>

請閱讀有關DOMDocument的信息 您可以使用以下方法:getElementsByTagName,getElementById等。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM