繁体   English   中英

无法使用HTMLUnit获取页面

[英]Unable to get a page using Htmlunit

我正在使用下面的代码

import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class Test {

public static void main(String[] args) 
{

    String url = "https://www.samsclub.com/sams/account/signin/login.jsp";

    try (final WebClient wc  = new WebClient())

    {             
        wc.getCookieManager().setCookiesEnabled(true);
        wc.getOptions().setUseInsecureSSL(true);
        wc.getOptions().setJavaScriptEnabled(false);
        wc.getOptions().setThrowExceptionOnScriptError(false);
        wc.getOptions().setThrowExceptionOnFailingStatusCode(false);
        wc.getOptions().setCssEnabled(false);
        //wc.getOptions().setRedirectEnabled(true);
        //wc.getOptions().setTimeout(0);
        final HtmlPage page = wc.getPage(url);
        System.out.println(page.asText());
    }
    catch (Exception e) {
        e.printStackTrace();
    }
}
}

但是在默认超时之后,java.net.SocketTimeoutException:读取超时异常引发任何想法,为什么我没有获得登录页面?

这真的很奇怪。 我在计算机上尝试了此操作,但也失败了(浏览器上的网站看起来不错)。 我甚至不能wgetcurl此页面。

我也尝试过更换代理等。您可以自己检查

curl -vvvv https://www.samsclub.com/sams/account/signin/login.jsp                                                                    

因此,您的程序不是唯一与此页面有问题的程序,我坚信问题是沃尔玛应用程序而不是您的代码。

为了解决此问题,您可以在浏览器中启动调试模式,而不是检查尝试获取页面时实际发生的情况。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM