繁体   English   中英

HTmlUnit 不会抓取整个页面

[英]HTmlUnit doesn't grab entire page

HtmlUnit 2.14 版我正在尝试抓取此页面 这是我的代码:

public class Main {

  static final WebClient browser;

  static {

    browser = new WebClient(BrowserVersion.FIREFOX_24);
    browser.getOptions().setJavaScriptEnabled(true);

    CookieManager cookieMan = new CookieManager();
    cookieMan = browser.getCookieManager();
    cookieMan.setCookiesEnabled(true);

    browser.getOptions().setRedirectEnabled(true);
    browser.getOptions().setThrowExceptionOnFailingStatusCode(false);

    browser.getOptions().setPrintContentOnFailingStatusCode(true);
    browser.getOptions().setThrowExceptionOnScriptError(false);


  }

  public static void main(String[] arguments) {


    doTestHANJINMobile();

  }

  private static void doTestHANJINMobile() {

    try {


      HtmlPage page = (HtmlPage) browser.getPage("http://m.hanjin.com/mhanjin/CUP_MOB_0802.do?menuFlag=C&searchType=C&blCntrNo=CAXU3336862");

      System.out.println("waitForBackgroundJavaScript...");
      browser.waitForBackgroundJavaScriptStartingBefore(5000);
      browser.waitForBackgroundJavaScript(5000);

      System.out.println("XML Source : \n" + page.asXml() + "\n");

    } catch (Exception e) {
      System.out.println("EXCEPTION --------------- " + e.toString());
    }

  }
}

但我只得到“航行信息”表而不是“集装箱详细信息”表。 我尝试使用其他浏览器版本(IE、Chrome ..)但没有任何反应......

它适用于 HtmlUnit 2.15 版!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM