簡體   English   中英

為什么HTMLunit不能在這個https網頁上運行?

[英]Why doesn't HTMLunit work on this https webpage?

我正在嘗試更多地了解HTMLunit並進行一些測試。 我正在嘗試從此站點獲取頁面標題和文本等基本信息:

https://....com (刪除了完整的網址,重要的是它是https)

我使用的代碼就是這個,在其他網站上運行正常:

 final WebClient webClient = new WebClient();
  final HtmlPage page;
  page = (HtmlPage)webClient.getPage("https://medeczane.sgk.gov.tr/eczane/login.jsp");
  System.out.println(page.getTitleText());
  System.out.println(page.asText());

為什么我不能獲得這些基本信息? 如果是因為安全措施,具體是什么,我可以繞過它們嗎? 謝謝。

編輯:嗯,代碼在webclient.getpage()之后停止工作; ,test2沒有寫。 所以我無法檢查頁面是否為空。

  final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_2);
  final HtmlPage page;
  System.out.println("test1");
    try {
        page = (HtmlPage)webClient.getPage("https://medeczane.sgk.gov.tr/eczane/login.jsp");
      System.out.println("test2");

我通過添加以下代碼解決了這個問題:

webClient.setUseInsecureSSL(true);

這是一種禁用安全SSL的棄用方式。 在當前的HtmlUnit版本中,您必須執行以下操作:

webClient.getOptions().setUseInsecureSSL(true);

我認為這是一個身份驗證問題 - 如果我在Firefox中找到該頁面,我會得到一個登錄框。

嘗試

webClient.setAuthentication(realm,username,password);

在調用getPage()之前

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM