簡體   English   中英

PHP - 從HTML中提取文本

[英]PHP - Extracting text from HTML

我有一長串HTML包含

<p>
<img>
<span> 

和一堆其他標簽。

無論如何只從該字符串中提取標簽內的文本?

如果要提取任何標記中的所有文本,最簡單的方法是去除標記: strip_tags()

如果你想刪除特定的標簽,也許這個問題有幫助。

我知道我會為此付出很多抨擊,但對於像這樣的簡單任務,我會使用正則表達式。

preg_match_all('~(<span>(.*?)</span>)~', $html, $matches);

$matches[0]將包含所有span標簽及其內容, $matches[1]僅包含內容。

對於更復雜的東西,您可能需要查看PHP Simple HTML DOM Parser或類似的東西:

// Create DOM from URL or file
$html = str_get_html($html);

// Find all images
foreach($html->find('img') as $element) {
   echo $element->src . '<br>';
}

等等。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM