簡體   English   中英

從數據庫中的推文中刪除停用詞和超鏈接

[英]Removing Stopwords and hyperlinks from tweets in database

我想刪除存儲在MySQL數據庫中的推文的所有超鏈接和停用詞。 也是以http://開頭的超鏈接。

我們可以使用正則表達式在java中完成這些任務

刪除StopWords

String.replaceAll(STOPWORD,"")

刪除超鏈接

String.replaceAll("http[^\\s]+","")

刪除URl's不以http開頭

String.replaceAll("www[^\\s]+","")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM