[英]Ignoring spam/ads from a url using jsoup
我正在使用jsoup解析器加载某些网站的内容。 通常,某些网站的页面上有广告和其他不相关的内容。 解析网址时可以忽略这些吗?
不,Jsoup中没有内置的避免广告链接功能。 您必须手动执行此操作(通过检查每个页面的广告网址,并将其与正则表达式进行匹配)。
这不是您问题的直接答案,但是您可以使用AlchemyAPI。 他们有一个免费的1,000个API调用程序(如果出于学术目的,则有30,000个):
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.