繁体   English   中英

如何使用html解析和jsoup获取图像

[英]how to get image using html parsing with jsoup

我想使用与jsoup的html解析来获取所有图像。 我使用下面的代码;

Elements images = doc.select("img[src~=(?i)\\.(jpe?g)]");
        for (Element image : images) {

            //System.out.println("\nsrc : " + image.attr("src"));
            arrImageItem.add(image.attr("src"));

        }

我解析此方法所有图像,但我想解析此网址

http://tvrehberi.hurriyet.com.tr/images/742/403742.jpg

我想解析此网址的beginnig

http://tvrehberi.hurriyet.com.tr/images .... .jpg

如何获得这样的解析?

这可能会给您您要的内容,尽管您的问题还不清楚,所以我不确定。

public static void main(String args[]){

    Document doc = null;
    String url = "http://tvrehberi.hurriyet.com.tr";
    try {
        doc = Jsoup.connect(url).get();
    } catch (IOException e1) {
        e1.printStackTrace();
    }

    for (Element e : doc.select("img[src~=(?i)\\.(jpe?g)]")) {
        if(e.attr("src").startsWith("http://tvrehberi.hurriyet.com.tr/images")){
            System.out.println(e.attr("src"));
        }
    }
}

因此,这可能不是一个非常“干净”的解决方案,但是if语句将确保它仅从服务器上的/ images /-目录中打印出图像URL。

如果我理解正确,则希望检索到特定位置的URL路径,然后切断其余部分。 您甚至每次都要这样做吗? 如果在示例中仅使用来自一个站点的URL,则可以将"http://tvrehberi.hurriyet.com.tr/images"存储为常量,因为它永远不会更改。 另一方面,如果您从许多不同的站点获取URL,则可以按此处所述解析URL。
无论如何,如果您具有解析URL的目的,那么我们当然可以为您提供更多帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM