使用Jsoup从表和网站的所有选项卡中获取链接

Question

我是网络爬虫的新手，所以这个问题可能还没有得到很好的解决。 我试图按字母顺序从给定页面中提取所有药品名称链接，并因此提取所有az药品链接，然后遍历这些链接以从诸如通用名称，品牌等每个此类信息中提取信息。我有一个非常基本的知识下面的代码不起作用。 在解决此问题方面的一些帮助将不胜感激。

public class WebScraper {
  public static void main(String[] args) throws Exception {

    String keyword = "a"; //will iterate through all the alphabets eventually
    String url = "http://www.medindia.net/drug-price/brand-index.asp?alpha=" + keyword; 

    Document doc = Jsoup.connect(url).get();
    Element table = doc.select("table").first();
    Elements links = table.select("a[href]"); // a with href
    for (Element link : links) {
    System.out.println(link.attr("href"));
  }
}

Answer 1

在查看了网站以及您期望获得的结果之后，您似乎正在获取错误的表格元素。 您不想要第一张桌子，您想要第二张桌子。

要获取特定的表，可以使用以下命令：

Element table = doc.select("table").get(1);

这将使表位于索引1，即文档中的第二个表。

使用Jsoup从表和网站的所有选项卡中获取链接

问题描述

1 个解决方案

解决方案1
1 已采纳 2018-03-02 04:58:37

使用Jsoup从表和网站的所有选项卡中获取链接

问题描述

1 个解决方案

解决方案1 1 已采纳 2018-03-02 04:58:37

解决方案1
1 已采纳 2018-03-02 04:58:37