繁体   English   中英

查找出现在字符串中单词之前的子字符串直到一个数字

[英]Find a substring that appears before a word in a string upto a number

我有一个字符串:

"abc mysql 23 rufos kanso engineer"

我希望正则表达式在“工程师”一词之前输出字符串,直到它看到一个数字。

那就是正则表达式应该输出:

23 rufos kanso

另一个例子:

细绳:

def grusol defno 1635 minos kalopo, ruso engineer okas puno"

我希望正则表达式在“工程师”一词之前输出字符串,直到它看到一个数字。

那就是正则表达式应该输出:

1635 minos kalopo, ruso

我能够通过一系列 regex 来实现这一点。

我可以一次性完成吗?

谢谢

我使用的模式: ((\\d+)(?!.*\\d).*)engineer -- 它查找最新的数字并从那里开始。

类似于(\\d.*)engineer也可以使用,但前提是字符串中只有一位数字。


>>> import re
>>> string = '123 abc mysql 23 rufos kanso engineer'
>>> pattern = r'((\d+)(?!.*\d).*)engineer'
>>> re.search(pattern, string).group(1)
'23 rufos kanso '
>>>

编辑

如果“工程师”部分后面有数字,则上述模式不起作用,正如您在评论中指出的那样。 我试图解决它,但老实说我无法想出一个新的模式(抱歉)。

我可以建议的解决方法是,假设“工程师”仍然是“关键”词,将您的初始字符串按所述词分开。

这是我的意思的插图:

>>> string = '123 abc mysql 23 rufos kanso engineer 1234 b65 de'
>>> string.split('engineer')
['123 abc mysql 23 rufos kanso ', ' 1234 b65 de']
>>> string.split('engineer')[0] 
'123 abc mysql 23 rufos kanso '

# hence, there would be no unexpected digits

>>> s = string.split('engineer')[0]
>>> pattern = r'((\d+)(?!.*\d).*)'
>>> re.search(pattern, s).group(1)
'23 rufos kanso '

使用positive look-ahead来匹配直到前面有一个数字的工程师这个词。

The regex - (?=\\d)(.+)(?=engineer)

只是为了得到一个想法:

import re
pattern = r"(?=\d)(.+)(?=engineer)"
input = [ "\"def grusol defno 1635 minos kalopo, ruso engineer okas puno\"", "\"abc mysql 23 rufos kanso engineer\"" ]

matches = []

for item in input:
    matches.append(re.findall(pattern, item))

输出:

[['1635 minos kalopo, ruso '], ['23 rufos kanso ']]

看看这个网站 玩正则表达式很棒,它解释了每个步骤。
这是您问题的解决方案:链接

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM