[英]how to get image using html parsing with jsoup
我想使用与jsoup的html解析来获取所有图像。 我使用下面的代码;
Elements images = doc.select("img[src~=(?i)\\.(jpe?g)]");
for (Element image : images) {
//System.out.println("\nsrc : " + image.attr("src"));
arrImageItem.add(image.attr("src"));
}
我解析此方法所有图像,但我想解析此网址
我想解析此网址的beginnig
http://tvrehberi.hurriyet.com.tr/images .... .jpg
如何获得这样的解析?
这可能会给您您要的内容,尽管您的问题还不清楚,所以我不确定。
public static void main(String args[]){
Document doc = null;
String url = "http://tvrehberi.hurriyet.com.tr";
try {
doc = Jsoup.connect(url).get();
} catch (IOException e1) {
e1.printStackTrace();
}
for (Element e : doc.select("img[src~=(?i)\\.(jpe?g)]")) {
if(e.attr("src").startsWith("http://tvrehberi.hurriyet.com.tr/images")){
System.out.println(e.attr("src"));
}
}
}
因此,这可能不是一个非常“干净”的解决方案,但是if语句将确保它仅从服务器上的/ images /-目录中打印出图像URL。
如果我理解正确,则希望检索到特定位置的URL路径,然后切断其余部分。 您甚至每次都要这样做吗? 如果在示例中仅使用来自一个站点的URL,则可以将"http://tvrehberi.hurriyet.com.tr/images"
存储为常量,因为它永远不会更改。 另一方面,如果您从许多不同的站点获取URL,则可以按此处所述解析URL。
无论如何,如果您具有解析URL的目的,那么我们当然可以为您提供更多帮助。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.