[英]In Jsoup, how do I parse the CSS query by the attribute, instead of the data?
[英]How do I use CSS selectors in JSoup to select all elements containing images, including in a data-src (HTML5 dataset) attribute?
我正在嘗試使用JSoup解析任何網頁並以編程方式標識內容塊的元素,這些內容塊定義為多次出現且包含文本,鏈接和圖像的任何元素。 一切順利,直到我進入http://fanside.com/為止。 此頁面上的圖像未顯示在<img>
標記中,而是顯示在諸如data-background="http://cdn.fansided.com/wp-content/blogs.dir/314/files/2015/01/8O7hjxQ-268x150.png"
。
有沒有辦法使用單個CSS選擇器(也許是正則表達式?)來選擇所有包含圖像的元素,而不管它們的類型如何?
試試這個
Document doc = Jsoup.connect("http://fansided.com/").userAgent("Mozilla").get();
Elements select = doc.select("[data-background],[style~=background:url]");
它將獲取包含“ data-background”或“ style = background:url ...”屬性的任何元素。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.