簡體   English   中英

Jsoup返回的文本我在HTML文檔中看不到

[英]Jsoup is returning text which I do not see in the HTML document

public class Test {
   public static void main(String[] args) throws IOException {
     Document doc = Jsoup.connect("https://bs.to/Game-of-Thrones").get();
     Elements link = doc.select("p");

     System.out.println(link.text());
   }
}

這是我用來獲取給定網站的唯一p標簽元素的代碼。 但是我得到一個文本,該文本不在html文檔中。 它似乎是屬於一般網站的文本(它是德語的,所以我不介意發布結果文本)。

另外,如果我循環所有p元素,則會得到更多文本,該文本不應出現在文檔中,而是出現在我要查找的文本中。

為什么會這樣呢? 提前致謝!

編輯:

  Document doc = Jsoup.connect("https://bs.to/andere-serien")
                  .userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US;    rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
                  .referrer("http://www.google.com")
                  .get();

感謝Sean Patrick Floyd,添加userAgent確實解決了該問題!

可能是他們為不同的用戶代理提供不同的內容。 嘗試將您的用戶代理設置為真實瀏覽器的用戶代理。

請參閱以下問題以獲取解決方案:
JSoup UserAgent,如何正確設置?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM