[英]Extract image id with Jsoup
我正在嘗試使用api Jsoup提取特定的驗證碼圖像ID,html圖像標簽如下所示:
<img id="wlspispHIPBimg03256465465dsd5456" style="display: inline; width: 200px; height: 100px;" aria-hidden="true" src="https://users/hip/data/rnd=435cb60d0a6b63ef4">
這是我的代碼,用於獲取屬性id="wlspispHIPBimg03256465465dsd5456"
:
doc = Jsoup.connect("http://go.microsoft.com/fwlink/?LinkID=614866&clcid")
.timeout(0).get();
Elements images = doc.select("img[src~=(?i)]");
for (Element image : images) {
System.out.println(image.attr("id"));
}
問題是我無法獲得驗證碼圖像的ID
您需要在html中找到可以區分文檔中其他任何標簽的img標簽的內容。 從您無法推斷的已發布代碼中,所以我在這里發揮我的想象力:
Element imageEl = doc.select("img[scr*=rnd]").first();
這利用了圖像源在其路徑中包含“ rnd”的情況。 為了獲得最佳的解決方案,您必須自己看看。 如果您學習Jsoup的CSS選擇器,也會很有幫助。
我認為您無法僅使用Jsoup來完成此操作,DOM在運行時使用javascript進行了修改,而jsoup根本不執行它。
另請參閱其他問題 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.