[英]Xidel extract data inside the tag — raw output
很高兴成为 StackOverflow 的成员,在这里潜伏了很长时间。
我需要解析两个标签之间的文本,到目前为止我找到了一个很棒的工具,叫做Xidel
我需要解析两者之间的文本
<div class="description"> Text. <tag>Also tags.</tag> More text. </div>
但是,所述文本中可以包含 HTML 标签,我希望它们以原始格式打印出来。 所以使用如下命令:
xidel --xquery '//div[@class="description"]' file.html
得到我:
Text. Also tags. More text.
我需要它完全一样,所以:
Text. <tag>Also tags.</tag> More text.
我怎样才能做到这一点?
问候, R
可以通过 Xidel 以多种方式完成,这就是我非常喜欢它的原因。
HTML 模板:
xidel -s file.html -e "<div class='description'>{inner-html()}</div>"
X路径:
xidel -s file.html -e "//div[@class='description']/inner-html()"
CSS:
xidel -s file.html -e "inner-html(css('div.description'))"
顺便说一句,在 Linux 上:将双引号换成单引号,反之亦然。
您可以通过添加--output-format=xml
选项来显示标签。
xidel --xquery '//div[@class="description"]' --output-format=xml file.html
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.