简体   繁体   English

使用jsoup从表中提取内容

[英]Extract the content from the table using jsoup

I am trying to parse the following page. 我正在尝试解析以下页面。

Document doc = Jsoup.connect(“http://www.informatik.unitrier.de/~ley/pers/hd/h/Han:Jiawei.html“).get();

I need to extract the contents of the 1st table, that is only author names and their publications. 我需要提取第一张表的内容,仅是作者姓名及其出版物。 But I need only the contents of the table from the year 1986 to year 2012. What could be the possible syntax in jsoup? 但是我只需要从1986年到2012年的表内容。jsoup中可能的语法是什么?

Any help will be appreciated . 任何帮助将不胜感激 。

The data of this website is using javascript , so it's not possible to parse it with jsoup. 该网站的数据使用的是javascript ,因此无法使用jsoup进行解析。

I've listed some alternatives in this answer: Trying to parse html hidden by javascript 我在此答案中列出了一些替代方法: 尝试解析javascript隐藏的html

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM