[英]Fetching data from another website with JSOUP
基本上,我需要一個包含所有可能存在的書的表,而我不想這樣做,因為我是一個非常懶惰的人xD。 所以,我的問題是..我可以使用一個我想過的網站,就像切斷該網站的其余部分(不需要的)並只保留搜索部分(也許在其中進行某些更改)一樣。版式...),然后進行搜索,查找書籍並將僅對我有意義的數據存儲在我的數據庫中。 那可能嗎? 我聽說JSOUP可以提供幫助。 所以,我只想要一些技巧。 (閱讀時要謝謝)。
是的,您可以使用Jsoup做到這一點,主要問題是共享的URL使用JavaScript,因此您需要使用Selenium強制執行JS,或者還可以獲取書的URL並對其進行解析。
使用Jsoup解析Web的方法是:
Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
.userAgent("Mozilla/5.0")
.get();
您可以在文檔中檢索整個HTML,因此可以使用CSS選擇器獲取元素中包含的任何元素,例如,如果要在HTML中檢索網絡標題,則可以使用:
Elements elements = document.select("title");
對於您要從中檢索信息的每個HTML標簽。 您可以檢查Jsoup Doc並檢查一些解釋的示例: Jsoup
希望對您有幫助!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.