[英]Skipping nodes when using DomXpath in PHP
我正在使用DomXpath查詢來查找文件中的所有HTML元素,這些HTML元素包含當瀏覽器呈現頁面時用戶會看到的文本。
以下幾行代碼很好地完成了該技巧:
$xpath = new DOMXpath($doc);
$results = $xpath->query("//text()");
但是,有一些副作用。 例如,如果您有一個
<style>
標記在HTML中,它將在其中讀取並解析所有CSS元素,我想完全忽略它。 我似乎找不到一種形成上述查詢的方法來忽略一個或多個文本元素。 任何幫助,將不勝感激。
我找到了避免<style>
標記的方法。
$results = $xpath->query("//body//text()")
這將忽略HTML文件正文之前的所有內容。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.