簡體   English   中英

正則表達式刪除超鏈接

[英]regex to remove hyperlinks

輸入:
來源http://www.emaxhealth.com/1275/從此處進行誤診http://www.cancerresearchuk.org/about-cancer/type講述了她的經歷和思想博客http://fty720.blogspot.com甚至還包含了新內容名稱。 她離家很遠。


從關於輸入我想刪除超鏈接。 下面是我正在嘗試的正則表達式

http://[\\w|\\W|\\d|\\s]*(?=[ ])

此正則表達式在遇到單詞“ http”后將包含所有字符,數字和空格,並將一直持續到第一個空格。 不幸的是,它沒有按預期工作。 請幫助我找出我的錯誤。謝謝

試試這個sed命令

sed  's/http[^ ]\+//g' FileName

輸出:

消息來源稱她的經歷和思想博客甚至帶有新名稱。 她離家很遠。

要查找超鏈接,請使用:

\b(https?)://[A-Z0-9+&@#/%?=~_|$!:,.;-]*[A-Z0-9+&@#/%=~_|$]

要么:


如果要查找html標簽,請使用:

<a\b[^>]*>(.*?)</a>

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM