如何使用html解析和jsoup获取图像

Question

我想使用与jsoup的html解析来获取所有图像。 我使用下面的代码；

Elements images = doc.select("img[src~=(?i)\\.(jpe?g)]");
        for (Element image : images) {

            //System.out.println("\nsrc : " + image.attr("src"));
            arrImageItem.add(image.attr("src"));

        }

我解析此方法所有图像，但我想解析此网址

http://tvrehberi.hurriyet.com.tr/images/742/403742.jpg

我想解析此网址的beginnig

http://tvrehberi.hurriyet.com.tr/images .... .jpg

如何获得这样的解析？

Answer 1

这可能会给您您要的内容，尽管您的问题还不清楚，所以我不确定。

public static void main(String args[]){

    Document doc = null;
    String url = "http://tvrehberi.hurriyet.com.tr";
    try {
        doc = Jsoup.connect(url).get();
    } catch (IOException e1) {
        e1.printStackTrace();
    }

    for (Element e : doc.select("img[src~=(?i)\\.(jpe?g)]")) {
        if(e.attr("src").startsWith("http://tvrehberi.hurriyet.com.tr/images")){
            System.out.println(e.attr("src"));
        }
    }
}

因此，这可能不是一个非常“干净”的解决方案，但是if语句将确保它仅从服务器上的/ images /-目录中打印出图像URL。

Answer 2

如果我理解正确，则希望检索到特定位置的URL路径，然后切断其余部分。 您甚至每次都要这样做吗？ 如果在示例中仅使用来自一个站点的URL，则可以将"http://tvrehberi.hurriyet.com.tr/images"存储为常量，因为它永远不会更改。 另一方面，如果您从许多不同的站点获取URL，则可以按此处所述解析URL。
无论如何，如果您具有解析URL的目的，那么我们当然可以为您提供更多帮助。

如何使用html解析和jsoup获取图像

问题描述

2 个解决方案

解决方案1
0 已采纳 2013-02-07 20:48:21

解决方案2
0 2013-02-08 13:19:18

如何使用html解析和jsoup获取图像

问题描述

2 个解决方案

解决方案1 0 已采纳 2013-02-07 20:48:21

解决方案2 0 2013-02-08 13:19:18

解决方案1
0 已采纳 2013-02-07 20:48:21

解决方案2
0 2013-02-08 13:19:18