[英]Unable to parse img and name from amazon or flipkart pages using Jsoup
我無法使用Jsoup獲得Amazon或Flipkart產品的主要圖像和名稱。
我的java / jsoup代碼相同:
// For amazon
Connection connection = Jsoup.connect(url).timeout(5000).maxBodySize(1024*1024*10);
Document doc = connection.get();
Elements imgs = doc.select("img#landingImage");
Elements names = doc.select("span#productTitle");
// For flipkart
Connection connection = Jsoup.connect(url).timeout(5000).maxBodySize(1024*1024*10);
Document doc = connection.get();
Elements imgs = doc.select("h1.title");
Elements names = doc.select("img.productImage.current");
有人可以指出我在這里想念什么嗎?
我使用的網址是:
和
另外,如果可能,我想使用javascript和jquery在前端進行此解析。
有沒有辦法做同樣的事情?
找出問題所在。
當我們使用java.net.URL的URL提取服務時,GAE中的Jsoup可以工作:
private String read(String url) throws IOException
{
URL urlObj = new URL(url);
BufferedReader reader = new BufferedReader(new InputStreamReader(urlObj .openStream()));
String line;
StringBuffer sbuf = new StringBuffer();
while ((line = reader.readLine()) != null) {
if (line.trim().length() > 0)
sbuf.append(line).append("\n");
}
reader.close();
return sbuf.toString();
}
然后將常規的Jsoup用作:
String html = read(url);
Document doc = Jsoup.parse(html);
進行上述操作效果很好。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.