[英]How can I remove a specific character from multi line string using regex in python
我有一個多行字符串,如下所示:
st = '''emp:firstinfo\n
:secondinfo\n
thirdinfo
'''
print(st)
我想要做的是從我的字符串中跳過第二個':',並得到一個看起來像這樣的 output:
'''emp:firstinfo\n
secondinfo\n
thirdinfo
'''
簡單地說,如果它以':'開頭,我試圖忽略它。
這是我所做的:
mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)
print(mat_obj.group())
顯然,我沒有看到我的錯誤,但誰能幫我告訴我哪里出錯了?
您可以將re.sub
與此正則表達式一起使用:
>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))
emp:firstinfo
secondinfo
thirdinfo
正則表達式詳細信息:
(
: 開始第一個捕獲組
[^:\n]*
: 匹配 0 個或多個不是:
和換行符的任何字符:
匹配冒號[^:\n]*
: 匹配 0 個或多個不是:
和換行符的任何字符\n
: 匹配新行)
: 結束第一個捕獲組\s*
: 匹配 0 個或多個空格:
匹配冒號(.+)
:匹配第 2 個捕獲組中的 1 個或多個任意字符(換行符除外)\1\2
:用於替換第 1 組和第 2 組中捕獲的 substring。您可以使用 sub 代替,只是不要捕獲不需要的部分。
(.*\n)[^:]*:(.*\n)(.*)
替換為
\1\2\3
import re
regex = r"(.*\n)[^:]*:(.*\n)(.*)"
test_str = ("emp:firstinfo\\n\n"
" :secondinfo\\n\n"
" thirdinfo")
subst = "\\1\\2\\3"
# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)
#import regex library
重新進口
#remove character in a String and replace with empty string.
text = "電影低俗小說於 1994 年上映" result = re.sub(r"[az]", "", text) print(result)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.