Jsoup从HTML内容中提取Href

Question

我的问题是我尝试使用JSoup从此站点获取Href

但它不起作用。

我试图像这样从Href中选择班级

Elements elements = documentMainSite.select(".a-link-normal");

之后，我尝试使用以下代码提取Href。

for (Element element : elements) {
  String href = element.attributes().get("href");
}

但不幸的是它什么也没给我...

有人可以告诉我我的错误在哪里吗？

我不只是连接到该网站。 我还通过使用以下方法将hrefs保存为字符串：

String href = element.attributes().get("href");

之后，我打印了href字符串，但为空。

另一方面，代码可与另一个CSS选择器一起使用。 因此它本身与代码无关。 它只是CSS选择器（.a-link-normal）可能是错误的。

Answer 1

仅通过Jsoup连接到url就不会有任何结果。

Document document = Jsoup.connect(yourUrl).get();
String bodyText = document.getElementsByTag("body").get(0).text();

这是正文的翻译，是我从上面的代码中获得的。

在下面输入字符。我们要求您的理解，并希望确保您不是机器人。 为了获得最佳效果，请使用接受cookie的浏览器。 键入您在图像中看到的字符：输入字符尝试其他图像继续购物条款和条件隐私政策©1996-2015，Amazon.com，Inc.或其分支机构

例如，您需要绕过验证码或通过Selenium模拟浏览器。