[英]Jsoup is returning text which I do not see in the HTML document
public class Test {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.connect("https://bs.to/Game-of-Thrones").get();
Elements link = doc.select("p");
System.out.println(link.text());
}
}
這是我用來獲取給定網站的唯一p標簽元素的代碼。 但是我得到一個文本,該文本不在html文檔中。 它似乎是屬於一般網站的文本(它是德語的,所以我不介意發布結果文本)。
另外,如果我循環所有p元素,則會得到更多文本,該文本不應出現在文檔中,而是出現在我要查找的文本中。
為什么會這樣呢? 提前致謝!
編輯:
Document doc = Jsoup.connect("https://bs.to/andere-serien")
.userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
.referrer("http://www.google.com")
.get();
感謝Sean Patrick Floyd,添加userAgent確實解決了該問題!
可能是他們為不同的用戶代理提供不同的內容。 嘗試將您的用戶代理設置為真實瀏覽器的用戶代理。
請參閱以下問題以獲取解決方案:
JSoup UserAgent,如何正確設置?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.