簡體   English   中英

使用JSOUP從另一個網站獲取數據

[英]Fetching data from another website with JSOUP

基本上,我需要一個包含所有可能存在的書的表,而我不想這樣做,因為我是一個非常懶惰的人xD。 所以,我的問題是..我可以使用一個我想過的網站,就像切斷該網站的其余部分(不需要的)並只保留搜索部分(也許在其中進行某些更改)一樣。版式...),然后進行搜索,查找書籍並將僅對我有意義的數據存儲在我的數據庫中。 那可能嗎? 我聽說JSOUP可以提供幫助。 所以,我只想要一些技巧。 (閱讀時要謝謝)。

該網站: http : //www.isbn.bn.br/website/consulta/cadastro

是的,您可以使用Jsoup做到這一點,主要問題是共享的URL使用JavaScript,因此您需要使用Selenium強制執行JS,或者還可以獲取書的URL並對其進行解析。

使用Jsoup解析Web的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您可以在文檔中檢索整個HTML,因此可以使用CSS選擇器獲取元素中包含的任何元素,例如,如果要在HTML中檢索網絡標題,則可以使用:

Elements elements = document.select("title");

對於您要從中檢索信息的每個HTML標簽。 您可以檢查Jsoup Doc並檢查一些解釋的示例: Jsoup

希望對您有幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM