[英]Finding a string pattern using grep
我正在尝试在几个.txt文件的文本中找到特定的顺序。 我正在寻找连接到4位数字的字符串。 例如Watson1990。 我使用在线测试仪测试了正则表达式,它似乎可以正常工作,但是表达式(或其组合)未能在文件中产生输出。
我的正则表达式如下:
egrep '\w*\d{4}' *.txt
但是,它不会产生任何输出。 你能告诉我这是怎么了吗? 我正在使用OSX(雪豹)。
谢谢。
您的正则表达式不起作用的原因是,在扩展的正则表达式语法中,令牌\\d
与字母d
匹配,而不是数字。 请改用字符类[0-9]
。
\\w
还会匹配数字和字母,因此您可能不想在这里使用它。 使用字符类[A-Za-z]
匹配AZ或az中的字母。
我将*
更改为+
因为您可能希望数字前至少包含一个字母。 +
表示“一个或多个”,而*
表示“零个或多个”。
最后,您可能希望考虑如果看到5位数字会发生什么情况。 您的正则表达式当前接受它,因为5位数字以4位数字开头。
最后,请尝试以下操作:
egrep '[a-zA-Z]+[0-9]{4}' *.txt
您的正则表达式使用Perl,而不是扩展的regex组件。 尝试
grep -P '\w\d{4}' *.txt
如果您的grep版本具有该选项。 我正在使用GNU grep 2.5.1,并且-P
选项被列为“高度实验性”。
GNU grep
grep -Po "(\w+\d{4})" file
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.