使用JSOUP从另一个网站获取数据

Question

基本上，我需要一个包含所有可能存在的书的表，而我不想这样做，因为我是一个非常懒惰的人xD。 所以，我的问题是..我可以使用一个我想过的网站，就像切断该网站的其余部分（不需要的）并只保留搜索部分（也许在其中进行某些更改）一样。版式...），然后进行搜索，查找书籍并将仅对我有意义的数据存储在我的数据库中。 那可能吗？ 我听说JSOUP可以提供帮助。 所以，我只想要一些技巧。 （阅读时要谢谢）。

该网站： http : //www.isbn.bn.br/website/consulta/cadastro

Answer 1

是的，您可以使用Jsoup做到这一点，主要问题是共享的URL使用JavaScript，因此您需要使用Selenium强制执行JS，或者还可以获取书的URL并对其进行解析。

使用Jsoup解析Web的方法是：

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您可以在文档中检索整个HTML，因此可以使用CSS选择器获取元素中包含的任何元素，例如，如果要在HTML中检索网络标题，则可以使用：

Elements elements = document.select("title");

对于您要从中检索信息的每个HTML标签。 您可以检查Jsoup Doc并检查一些解释的示例： Jsoup

希望对您有帮助！

使用JSOUP从另一个网站获取数据

问题描述

1 个解决方案

解决方案1
1 已采纳 2018-10-25 10:31:59

使用JSOUP从另一个网站获取数据

问题描述

1 个解决方案

解决方案1 1 已采纳 2018-10-25 10:31:59

解决方案1
1 已采纳 2018-10-25 10:31:59