[英]Xidel extract data inside the tag — raw output
很高興成為 StackOverflow 的成員,在這里潛伏了很長時間。
我需要解析兩個標簽之間的文本,到目前為止我找到了一個很棒的工具,叫做Xidel
我需要解析兩者之間的文本
<div class="description"> Text. <tag>Also tags.</tag> More text. </div>
但是,所述文本中可以包含 HTML 標簽,我希望它們以原始格式打印出來。 所以使用如下命令:
xidel --xquery '//div[@class="description"]' file.html
得到我:
Text. Also tags. More text.
我需要它完全一樣,所以:
Text. <tag>Also tags.</tag> More text.
我怎樣才能做到這一點?
問候, R
可以通過 Xidel 以多種方式完成,這就是我非常喜歡它的原因。
HTML 模板:
xidel -s file.html -e "<div class='description'>{inner-html()}</div>"
X路徑:
xidel -s file.html -e "//div[@class='description']/inner-html()"
CSS:
xidel -s file.html -e "inner-html(css('div.description'))"
順便說一句,在 Linux 上:將雙引號換成單引號,反之亦然。
您可以通過添加--output-format=xml
選項來顯示標簽。
xidel --xquery '//div[@class="description"]' --output-format=xml file.html
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.