繁体   English   中英

Xidel 提取标签内的数据——原始输出

[英]Xidel extract data inside the tag — raw output

很高兴成为 StackOverflow 的成员,在这里潜伏了很长时间。

我需要解析两个标签之间的文本,到目前为止我找到了一个很棒的工具,叫做Xidel

我需要解析两者之间的文本

 <div class="description"> Text. <tag>Also tags.</tag> More text. </div>

但是,所述文本中可以包含 HTML 标签,我希望它们以原始格式打印出来。 所以使用如下命令:

xidel --xquery '//div[@class="description"]' file.html

得到我:

Text. Also tags. More text.

我需要它完全一样,所以:

Text. <tag>Also tags.</tag> More text.

我怎样才能做到这一点?

问候, R

可以通过 Xidel 以多种方式完成,这就是我非常喜欢它的原因。

HTML 模板:

xidel -s file.html -e "<div class='description'>{inner-html()}</div>"

X路径:

xidel -s file.html -e "//div[@class='description']/inner-html()"

CSS:

xidel -s file.html -e "inner-html(css('div.description'))"

顺便说一句,在 Linux 上:将双引号换成单引号,反之亦然。

您可以通过添加--output-format=xml选项来显示标签。

xidel --xquery '//div[@class="description"]' --output-format=xml file.html 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM