[英]How do I find HTML links missing the protocol in the href attribute?
我试图找到这样写不正确的链接:
<a href="mydomain.com">link</a>
我有这个正则表达式:
href *= *"? *(?!http|https|ftp)
但是,如果行不通……有什么想法吗?
谢谢
使用GNU grep
:
% echo '
<a href="http://mydomain.com">link</a>
<a href="https://mydomain.com">link</a>
<a href="ftp://mydomain.com">link</a>
<a title="My Domain"
href="mydomain.com">link</a>
' | grep --perl -o 'href[[:space:]]*=[[:space:]]*"(?!(ht|f)tps?://)[^"]+"'
href="mydomain.com"
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.