在python中使用正则表达式单词边界提取单词形式字符串

Question

假设我有一个这样的文件名，并且想在Python中将其一部分提取为字符串。

import re
fn = "DC_QnA_bo_v.15.12.3_DE_duplicates.xlsx"
rgx = re.compile('\b_[A-Z]{2}\b')
print(re.findall(rgx, fn))

预期输出为[DE] ，但实际输出为[] 。

Answer 1

你可以用

(?<=_)[A-Z]+(?=_)

这利用了双方的环顾四周，请参阅regex101.com上的演示 。 为了获得更严格的结果，您需要指定更多示例输入。

Answer 2

使用_([AZ]{2})

例如：

import re
fn = "DC_QnA_bo_v.15.12.3_DE_duplicates.xlsx"
rgx = re.compile('_([A-Z]{2})')
print(rgx.findall(fn))           #You can use the compiled pattern to do findall.

输出：

['DE']

Answer 3

您想要的输出似乎是DE ，它的左右两侧是两个_ 。 此表达式也可能起作用：

# -*- coding: UTF-8 -*-
import re

string = "DC_QnA_bo_v.15.12.3_DE_duplicates.xlsx"
expression = r'_([A-Z]+)_'
match = re.search(expression, string)
if match:
    print("YAAAY! \"" + match.group(1) + "\" is a match 💚💚💚 ")
else: 
    print('🙀 Sorry! No matches!')

产量

YAAAY! "DE" is a match 💚💚💚

或者，如果需要，可以添加2数量词：

# -*- coding: UTF-8 -*-
import re

string = "DC_QnA_bo_v.15.12.3_DE_duplicates.xlsx"
expression = r'_([A-Z]{2})_'
match = re.search(expression, string)
if match:
    print("YAAAY! \"" + match.group(1) + "\" is a match 💚💚💚 ")
else: 
    print('🙀 Sorry! No matches!')

DEMO

Answer 4

尝试模式： \\_([^\\_]+)\\_[^\\_\\.]+\\.xlsx

说明：

\\_ _从字面上匹配_

[^\\_]+ -带+运算符的否定字符类：匹配_以外的一个或多个字符

[^\\_\\.]+ -与上面相同，但是这次匹配的字符不是_和.

\\.xlsx .xlsx从字面上匹配.xlsx

演示

这个想法是在扩展名.xlsx之前匹配最后一个模式_something_

Answer 5

您可以使用正则表达式（ re模块）进行显示，但是可以通过以下方式不使用任何import来完成：

fn = "DC_QnA_bo_v.15.12.3_DE_duplicates.xlsx"
out = [i for i in fn.split('_')[1:] if len(i)==2 and i.isalpha() and i.isupper()]
print(out) # ['DE']

说明：我在_处分割fn ，然后丢弃第一个元素和过滤器元素，因此仅保留长度2的str s，该长度由字母组成，由大写字母组成。

Answer 6

另一种re的解决方案：

rgx = re.compile('_([A-Z]{1,})_')
print(re.findall(rgx, fn))

在python中使用正则表达式单词边界提取单词形式字符串

问题描述

6 个解决方案

解决方案1
2 已采纳 2019-05-21 06:29:51

解决方案2
1 2019-05-21 06:29:13

解决方案3
1 2019-05-21 06:34:06

产量

DEMO

解决方案4
1 2019-05-21 06:41:52

解决方案5
1 2019-05-21 07:11:41

解决方案6
0 2019-05-21 06:40:47

在python中使用正则表达式单词边界提取单词形式字符串

问题描述

6 个解决方案

解决方案1 2 已采纳 2019-05-21 06:29:51

解决方案2 1 2019-05-21 06:29:13

解决方案3 1 2019-05-21 06:34:06

产量

DEMO

解决方案4 1 2019-05-21 06:41:52

解决方案5 1 2019-05-21 07:11:41

解决方案6 0 2019-05-21 06:40:47

解决方案1
2 已采纳 2019-05-21 06:29:51

解决方案2
1 2019-05-21 06:29:13

解决方案3
1 2019-05-21 06:34:06

解决方案4
1 2019-05-21 06:41:52

解决方案5
1 2019-05-21 07:11:41

解决方案6
0 2019-05-21 06:40:47