簡體   English   中英

使用jsoup忽略網址中的垃圾郵件/廣告

[英]Ignoring spam/ads from a url using jsoup

我正在使用jsoup解析器加載某些網站的內容。 通常,某些網站的頁面上有廣告和其他不相關的內容。 解析網址時可以忽略這些嗎?

不,Jsoup中沒有內置的避免廣告鏈接功能。 您必須手動執行此操作(通過檢查每個頁面的廣告網址,並將其與正則表達式進行匹配)。

這不是您問題的直接答案,但是您可以使用AlchemyAPI。 他們有一個免費的1,000個API調用程序(如果出於學術目的,則有30,000個):

http://www.alchemyapi.com/api/text/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM