簡體   English   中英

如何使用html解析和jsoup獲取圖像

[英]how to get image using html parsing with jsoup

我想使用與jsoup的html解析來獲取所有圖像。 我使用下面的代碼;

Elements images = doc.select("img[src~=(?i)\\.(jpe?g)]");
        for (Element image : images) {

            //System.out.println("\nsrc : " + image.attr("src"));
            arrImageItem.add(image.attr("src"));

        }

我解析此方法所有圖像,但我想解析此網址

http://tvrehberi.hurriyet.com.tr/images/742/403742.jpg

我想解析此網址的beginnig

http://tvrehberi.hurriyet.com.tr/images .... .jpg

如何獲得這樣的解析?

這可能會給您您要的內容,盡管您的問題還不清楚,所以我不確定。

public static void main(String args[]){

    Document doc = null;
    String url = "http://tvrehberi.hurriyet.com.tr";
    try {
        doc = Jsoup.connect(url).get();
    } catch (IOException e1) {
        e1.printStackTrace();
    }

    for (Element e : doc.select("img[src~=(?i)\\.(jpe?g)]")) {
        if(e.attr("src").startsWith("http://tvrehberi.hurriyet.com.tr/images")){
            System.out.println(e.attr("src"));
        }
    }
}

因此,這可能不是一個非常“干凈”的解決方案,但是if語句將確保它僅從服務器上的/ images /-目錄中打印出圖像URL。

如果我理解正確,則希望檢索到特定位置的URL路徑,然后切斷其余部分。 您甚至每次都要這樣做嗎? 如果在示例中僅使用來自一個站點的URL,則可以將"http://tvrehberi.hurriyet.com.tr/images"存儲為常量,因為它永遠不會更改。 另一方面,如果您從許多不同的站點獲取URL,則可以按此處所述解析URL。
無論如何,如果您具有解析URL的目的,那么我們當然可以為您提供更多幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM