繁体   English   中英

如何在JSoup中使用CSS选择器来选择所有包含图像的元素,包括data-src(HTML5数据集)属性中的元素?

[英]How do I use CSS selectors in JSoup to select all elements containing images, including in a data-src (HTML5 dataset) attribute?

我正在尝试使用JSoup解析任何网页并以编程方式标识内容块的元素,这些内容块定义为多次出现且包含文本,链接和图像的任何元素。 一切顺利,直到我进入http://fanside.com/为止。 此页面上的图像未显示在<img>标记中,而是显示在诸如data-background="http://cdn.fansided.com/wp-content/blogs.dir/314/files/2015/01/8O7hjxQ-268x150.png"

有没有办法使用单个CSS选择器(也许是正则表达式?)来选择所有包含图像的元素,而不管它们的类型如何?

试试这个

Document doc = Jsoup.connect("http://fansided.com/").userAgent("Mozilla").get();
Elements select = doc.select("[data-background],[style~=background:url]");

它将获取包含“ data-background”或“ style = background:url ...”属性的任何元素。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM