如何使用 python 中的正则表达式从多行字符串中删除特定字符

Question

我有一个多行字符串，如下所示：

st = '''emp:firstinfo\n
       :secondinfo\n
       thirdinfo
     '''
print(st)

我想要做的是从我的字符串中跳过第二个'：'，并得到一个看起来像这样的 output：

'''emp:firstinfo\n
   secondinfo\n
   thirdinfo
   '''

简单地说，如果它以'：'开头，我试图忽略它。

这是我所做的：

mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)
print(mat_obj.group())

显然，我没有看到我的错误，但谁能帮我告诉我哪里出错了？

Answer 1

您可以将re.sub与此正则表达式一起使用：

>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))
emp:firstinfo
secondinfo

       thirdinfo

正则表达式演示

正则表达式详细信息：

( : 开始第一个捕获组
- [^:\n]* : 匹配 0 个或多个不是:和换行符的任何字符
- :匹配冒号
- [^:\n]* : 匹配 0 个或多个不是:和换行符的任何字符
- \n : 匹配新行
) : 结束第一个捕获组
\s* : 匹配 0 个或多个空格
:匹配冒号
(.+) ：匹配第 2 个捕获组中的 1 个或多个任意字符（换行符除外）
\1\2 ：用于替换第 1 组和第 2 组中捕获的 substring。

Answer 2

您可以使用 sub 代替，只是不要捕获不需要的部分。

(.*\n)[^:]*:(.*\n)(.*)

替换为

\1\2\3

Regex Demo

import re

regex = r"(.*\n)[^:]*:(.*\n)(.*)"

test_str = ("emp:firstinfo\\n\n"
    "       :secondinfo\\n\n"
    "       thirdinfo")

subst = "\\1\\2\\3"

# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

Answer 3

#import regex library

重新进口

#remove character in a String and replace with empty string.

text = "电影低俗小说于 1994 年上映" result = re.sub(r"[az]", "", text) print(result)

如何使用 python 中的正则表达式从多行字符串中删除特定字符

问题描述

3 个解决方案

解决方案1
3 已采纳 2019-09-22 07:15:39

解决方案2
0 2019-09-22 07:15:51

解决方案3
0 2019-09-22 07:51:28

如何使用 python 中的正则表达式从多行字符串中删除特定字符

问题描述

3 个解决方案

解决方案1 3 已采纳 2019-09-22 07:15:39

解决方案2 0 2019-09-22 07:15:51

解决方案3 0 2019-09-22 07:51:28

解决方案1
3 已采纳 2019-09-22 07:15:39

解决方案2
0 2019-09-22 07:15:51

解决方案3
0 2019-09-22 07:51:28