簡體   English   中英

復雜的Web文檔檢索

[英]Complex retrieval of a web document

我需要從網站檢索文檔並進行解析。 問題是:

  1. 該網站同時使用http和https協議
  2. 您需要登錄該網站(我有一個普通帳戶)
  3. 在登錄頁面上,至少有2個重定向只是為了自己登錄

我管理了HTTPS連接並發布了登錄名和密碼,但是在cookie管理和重定向方面遇到了麻煩。

commons-httpclient會有所幫助。

使用類似HtmlUnit的庫可能會有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM