簡體   English   中英

使用Jsoup Android解析HTML時URL錯誤

[英]Wrong URL when parsing HTML with Jsoup Android

您能幫我解析HTML網站嗎? 我需要獲取圖片的src並鏈接到另一頁,但是我不知道為什么我得到空列表這是我的代碼:

Elements elems2 = doc.select("div");
for (Element elem2 : elems2) {
    if (elem2.attr("class").equals("grid-box-img")) {
        System.out.println(elem2.attr("img"));
        kfunewphoto.add(elem2.attr("src"));
    }
}

和html的示例:

<div class="grid-box-img"><a href="http://cleverrussia.com/shou-talanty-uspej-uvidet-pervym/" rel="bookmark" title="Шоу &#8220;Таланты&#8221;. Успей увидеть первым!"><img width="680" height="470" src="https://i.stack.imgur.com/c7PGK.png" class="attachment-full wp-post-image" alt="shou-talanty-uspej-uvidet-pervym-clever-russia" /></a></div>

我需要獲取“ http://cleverrussia.com/wp-content/uploads/2014/10/shou-talanty-uspej-uvidet-pervym-clever-russia.png ”和第二部分代碼:

            Elements elems = doc.select("h2");
            for (Element elem : elems) {
                if (elem.attr("class").equals("entry-title")) {
                    str = elem.text();
                    kfunews.add(elem.text());
                    kfunewslist1.add(elem.attr("href"));
                }

<h2 class="entry-title"><a href="http://cleverrussia.com/shou-talanty-uspej-uvidet-pervym/" title="Permalink to Шоу &#8220;Таланты&#8221;. Успей увидеть первым!" rel="bookmark">Шоу &#8220;Таланты&#8221;. Успей увидеть первым!</a></h2>

我需要得到:“ http://cleverrussia.com/shou-talanty-uspej-uvidet-pervym/
這是頁面的完整代碼-查看源代碼: http : //cleverrussia.com/

錯誤是您正在嘗試選擇img和a作為屬性。 檢查下面的代碼,看看如何修復您的代碼。

// Prints the image source
System.out.println(elem2.select("img").attr("src"));
kfunewphoto.add(elem2.select("img").attr("src"));
// Prints the target link
System.out.println(elem.select("a").attr("href"));
kfunewslist1.add(elem.select("a").attr("href"));

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM