什么是最好的开源Web爬虫工具,用Java编写。

===============>>#1 票数:10 已采纳

试试crawler4j 您只需要实现一个简单的界面,该界面可以控制访问哪些URL以及如何处理每个已爬网的页面。

===============>>#2 票数:5

在java中我认为它归结为Nutch vs Heritrix 您应该指定您的需求以获得更好的答案。

  ask by cuneytykaya translate from so

未解决问题?本站智能推荐: