Jsoup Wiki刮板如何获取目录框

Question

我在刮除Wiki上的目录时遇到麻烦。 我正在为个人项目制作一个简单的Web抓取工具，但我不知道如何抓取这些数据。

这是我尝试从任何给定的Wiki页面抓取目录的尝试

 String contentOver = doc.select("#toclimit-3 > li").first().text();

这里是我要抓取的代码，请问如何仅获得“年代学”一词？

    <ul> 
    <li class="toclevel-1 tocsection-1"><a href="#Chronology"><span class="tocnumber">1</span> <span class="toctext">Chronology</span></a></li>

Answer 1

您可以通过类名获取它：

 Element li = doc.select("#toclimit-3 > li").first();
 String result = li.select(".toctext").first().text();

Jsoup Wiki刮板如何获取目录框

问题描述

1 个解决方案

解决方案1
1 已采纳 2014-03-12 19:07:08

Jsoup Wiki刮板如何获取目录框

问题描述

1 个解决方案

解决方案1 1 已采纳 2014-03-12 19:07:08

解决方案1
1 已采纳 2014-03-12 19:07:08