![](/img/trans.png)
[英]Regular expression to extract pattern form python pandas dataframe column with parenthesis
[英]Python regular expression to extract the parenthesis
我有以下繁琐的代码从字符串“ ABC(XYZ)”中提取“ ABC”和“(XYZ)”
import re
test_str = 'ABC(XYZ)'
partone = re.sub(r'\([^)]*\)', '', test_str)
parttwo_temp = re.match('.*\((.+)\)', test_str)
parttwo = '(' + parttwo_temp.group(1) + ')'
我想知道是否有人可以想到更好的正则表达式来拆分字符串。 谢谢。
您可以使用re.findall
>>> import re
>>> test_str = 'ABC(XYZ)'
>>> re.findall(r'\([^()]*\)|[^()]+', test_str)
['ABC', '(XYZ)']
>>> [i for i in re.findall(r'(.*)(\([^()]*\))', test_str)[0]]
['ABC', '(XYZ)']
[i for i in re.split(r'(.*?)(\(.*?\))', test_str) if i]
对于这种输入数据,我们可以将(
替换为space + (
并按空格分隔:
>>> s = 'ABC(XYZ)'
>>> s.replace("(", " (").split()
['ABC', '(XYZ)']
这样,我们在每个括号前都人为地创建了一个定界符 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.