簡體   English   中英

Xidel 提取標簽內的數據——原始輸出

[英]Xidel extract data inside the tag — raw output

很高興成為 StackOverflow 的成員,在這里潛伏了很長時間。

我需要解析兩個標簽之間的文本,到目前為止我找到了一個很棒的工具,叫做Xidel

我需要解析兩者之間的文本

 <div class="description"> Text. <tag>Also tags.</tag> More text. </div>

但是,所述文本中可以包含 HTML 標簽,我希望它們以原始格式打印出來。 所以使用如下命令:

xidel --xquery '//div[@class="description"]' file.html

得到我:

Text. Also tags. More text.

我需要它完全一樣,所以:

Text. <tag>Also tags.</tag> More text.

我怎樣才能做到這一點?

問候, R

可以通過 Xidel 以多種方式完成,這就是我非常喜歡它的原因。

HTML 模板:

xidel -s file.html -e "<div class='description'>{inner-html()}</div>"

X路徑:

xidel -s file.html -e "//div[@class='description']/inner-html()"

CSS:

xidel -s file.html -e "inner-html(css('div.description'))"

順便說一句,在 Linux 上:將雙引號換成單引號,反之亦然。

您可以通過添加--output-format=xml選項來顯示標簽。

xidel --xquery '//div[@class="description"]' --output-format=xml file.html 

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM