繁体   English   中英

使用JSOUP从另一个网站获取数据

[英]Fetching data from another website with JSOUP

基本上,我需要一个包含所有可能存在的书的表,而我不想这样做,因为我是一个非常懒惰的人xD。 所以,我的问题是..我可以使用一个我想过的网站,就像切断该网站的其余部分(不需要的)并只保留搜索部分(也许在其中进行某些更改)一样。版式...),然后进行搜索,查找书籍并将仅对我有意义的数据存储在我的数据库中。 那可能吗? 我听说JSOUP可以提供帮助。 所以,我只想要一些技巧。 (阅读时要谢谢)。

该网站: http : //www.isbn.bn.br/website/consulta/cadastro

是的,您可以使用Jsoup做到这一点,主要问题是共享的URL使用JavaScript,因此您需要使用Selenium强制执行JS,或者还可以获取书的URL并对其进行解析。

使用Jsoup解析Web的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您可以在文档中检索整个HTML,因此可以使用CSS选择器获取元素中包含的任何元素,例如,如果要在HTML中检索网络标题,则可以使用:

Elements elements = document.select("title");

对于您要从中检索信息的每个HTML标签。 您可以检查Jsoup Doc并检查一些解释的示例: Jsoup

希望对您有帮助!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM