[英]Regex not operator
我需要使用正则表达式将值排除在url域之外,该域将排除主机(例如:wordpress)和域类型(例如.com)以外的所有内容。 网址是动态的,每个结果包含2-3个值(www.example.com或example.org)。 我正在尝试使用此表达式,但是我只想找回要排除的每个项目的首字母:
表达方式
(?!wordpress|com|www)(\w+|\d+)
串
example.wordpress.com
结果
例
任何帮助将不胜感激
锚定您的正则表达式:
\b(?!wordpress|com|www)(\w+|\d+)\b
您可能还需要考虑(\\w+|\\d+)
是否真的是您的意思。 \\w
已经包含数字。 另外,URL中还允许使用其他字符,例如-
。 您需要处理吗?
如果要这样做,我将利用url的格式:任何内容(点)2级域(点)1级域:
^(?<level3>.*)[.]?(?<level2>.+)[.](?<level1>.+)$
这样是不是只在域部分之后?
(/\/(?!\/).*?\/(.*)/).exec("http://www.google.com/sdfsdf/fdsff")[1]
// returns sdfsdf/fdsff
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.