[英]regex to remove hyperlinks
輸入:
來源http://www.emaxhealth.com/1275/從此處進行誤診http://www.cancerresearchuk.org/about-cancer/type講述了她的經歷和思想博客http://fty720.blogspot.com甚至還包含了新內容名稱。 她離家很遠。
從關於輸入我想刪除超鏈接。 下面是我正在嘗試的正則表達式
http://[\\w|\\W|\\d|\\s]*(?=[ ])
此正則表達式在遇到單詞“ http”后將包含所有字符,數字和空格,並將一直持續到第一個空格。 不幸的是,它沒有按預期工作。 請幫助我找出我的錯誤。謝謝
試試這個sed命令
sed 's/http[^ ]\+//g' FileName
輸出:
消息來源稱她的經歷和思想博客甚至帶有新名稱。 她離家很遠。
要查找超鏈接,請使用:
\b(https?)://[A-Z0-9+&@#/%?=~_|$!:,.;-]*[A-Z0-9+&@#/%=~_|$]
要么:
如果要查找html標簽,請使用:
<a\b[^>]*>(.*?)</a>
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.