簡體   English   中英

如何在JSoup中使用CSS選擇器來選擇所有包含圖像的元素,包括data-src(HTML5數據集)屬性中的元素?

[英]How do I use CSS selectors in JSoup to select all elements containing images, including in a data-src (HTML5 dataset) attribute?

我正在嘗試使用JSoup解析任何網頁並以編程方式標識內容塊的元素,這些內容塊定義為多次出現且包含文本,鏈接和圖像的任何元素。 一切順利,直到我進入http://fanside.com/為止。 此頁面上的圖像未顯示在<img>標記中,而是顯示在諸如data-background="http://cdn.fansided.com/wp-content/blogs.dir/314/files/2015/01/8O7hjxQ-268x150.png"

有沒有辦法使用單個CSS選擇器(也許是正則表達式?)來選擇所有包含圖像的元素,而不管它們的類型如何?

試試這個

Document doc = Jsoup.connect("http://fansided.com/").userAgent("Mozilla").get();
Elements select = doc.select("[data-background],[style~=background:url]");

它將獲取包含“ data-background”或“ style = background:url ...”屬性的任何元素。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM