繁体   English   中英

使用jsoup解析URL时出现404错误

[英]404 error when parsing URL using jsoup

使用Jsoup时出现404错误。 调用为Document doc = Jsoup.parse(url, 30000) ,URL字符串为http://www.myland.co.il/%D7%9E%D7%97%D7%A9%D7%91-%D7%94%D7%A9%D7%A7%D7%99%D7%94并且该网址在Chrome中显示正常。 我得到的错误是java.io.IOException: 404 error loading URL http://www.myland.co.il/vmchk/××ש×-×שק××

有任何想法吗?

不要对网站使用parse()方法,而应使用connect() 因此,您可以设置更多的连接设置。

final String url = "http://www.myland.co.il/%D7%9E%D7%97%D7%A9%D7%91-%D7%94%D7%A9%D7%A7%D7%99%D7%94";

Document doc = Jsoup.connect(url).get();

但是问题是url编码:

Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=404, URL=http://www.myland.co.il/vmchk/××ש×-×שק××

即使将URL解码回utf-8也无法解决此问题。

您是否有“替代”网址?

尝试decodeURL()

String url = "http://www.myland.co.il/%D7%9E%D7%97%D7%A9%D7%91-%D7%94%D7%A9%D7%A7%D7%99%D7%94";
Document doc = Jsoup.connect(url.decodeURL()).get();

记住要添加到Jsoup的连接中:

 Jsoup.connect(url)
    .ignoreHttpErrors(true)
    .get();

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM