繁体   English   中英

正则表达式删除超链接

[英]regex to remove hyperlinks

输入:
来源http://www.emaxhealth.com/1275/从此处进行误诊http://www.cancerresearchuk.org/about-cancer/type讲述了她的经历和思想博客http://fty720.blogspot.com甚至还包含了新内容名称。 她离家很远。


从关于输入我想删除超链接。 下面是我正在尝试的正则表达式

http://[\\w|\\W|\\d|\\s]*(?=[ ])

此正则表达式在遇到单词“ http”后将包含所有字符,数字和空格,并将一直持续到第一个空格。 不幸的是,它没有按预期工作。 请帮助我找出我的错误。谢谢

试试这个sed命令

sed  's/http[^ ]\+//g' FileName

输出:

消息来源称她的经历和思想博客甚至带有新名称。 她离家很远。

要查找超链接,请使用:

\b(https?)://[A-Z0-9+&@#/%?=~_|$!:,.;-]*[A-Z0-9+&@#/%=~_|$]

要么:


如果要查找html标签,请使用:

<a\b[^>]*>(.*?)</a>

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM