簡體   English   中英

使用Jsoup提取圖像ID

[英]Extract image id with Jsoup

我正在嘗試使用api Jsoup提取特定的驗證碼圖像ID,html圖像標簽如下所示:

<img id="wlspispHIPBimg03256465465dsd5456" style="display: inline; width: 200px; height: 100px;" aria-hidden="true" src="https://users/hip/data/rnd=435cb60d0a6b63ef4">

這是我的代碼,用於獲取屬性id="wlspispHIPBimg03256465465dsd5456"

doc = Jsoup.connect("http://go.microsoft.com/fwlink/?LinkID=614866&clcid")
                .timeout(0).get();

Elements images = doc.select("img[src~=(?i)]");
for (Element image : images) {
    System.out.println(image.attr("id"));
}

問題是我無法獲得驗證碼圖像的ID

您需要在html中找到可以區分文檔中其他任何標簽的img標簽的內容。 從您無法推斷的已發布代碼中,所以我在這里發揮我的想象力:

Element imageEl = doc.select("img[scr*=rnd]").first();

這利用了圖像源在其路徑中包含“ rnd”的情況。 為了獲得最佳的解決方案,您必須自己看看。 如果您學習Jsoup的CSS選擇器,也會很有幫助。

我認為您無法僅使用Jsoup來完成此操作,DOM在運行時使用javascript進行了修改,而jsoup根本不執行它。

另請參閱其他問題

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM