[英]PHP - Extracting text from HTML
我有一長串HTML包含
<p>
<img>
<span>
和一堆其他標簽。
無論如何只從該字符串中提取標簽內的文本?
如果要提取任何標記中的所有文本,最簡單的方法是去除標記: strip_tags()
如果你想刪除特定的標簽,也許這個問題有幫助。
我知道我會為此付出很多抨擊,但對於像這樣的簡單任務,我會使用正則表達式。
preg_match_all('~(<span>(.*?)</span>)~', $html, $matches);
$matches[0]
將包含所有span標簽及其內容, $matches[1]
僅包含內容。
對於更復雜的東西,您可能需要查看PHP Simple HTML DOM Parser或類似的東西:
// Create DOM from URL or file
$html = str_get_html($html);
// Find all images
foreach($html->find('img') as $element) {
echo $element->src . '<br>';
}
等等。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.