如何使用正則表達式擺脫重復的特殊字符？

Question

我想去掉所有重復的點，除了一個點。

資料來源：

(1) "a... b."
(2) "a....... b... c."

我想要的結果：

(1) "a b."
(2) "a b c."

代碼：

import re

a = "a... b."
b = "a....... b... c."

result = re.sub("[^a-zA-Z0-9 \\.{1}]", "", a)
print(result)

result = re.sub("[^a-zA-Z0-9 \\.{1}]", "", b)
print(result)

result = re.sub("[^a-zA-Z0-9 ][\\.{2,}]", "", a)
print(result)

result = re.sub("[^a-zA-Z0-9 ][\\.{2,}]", "", b)
print(result)

不工作。

我該怎么做才能得到我的結果？

Answer 1

下面的代碼可以完成所需的任務

import re
result = re.sub("\\.{2,}","","a....b....c.d....e.")
print(result)

結果將是——
abc.de。

Answer 2

這將起作用：

import re
    
a = "a... b."
b = "a....... b... c."
    
result = re.sub("\\.{2,}","", a)
print(result)
    
result = re.sub("\\.{2,}","", b)
print(result)

Answer 3

您可以使用

re.sub(r'\.{2,}|[^a-zA-Z0-9.\s]', '', text)

請參閱正則表達式演示。

詳情：

\.{2,} - 兩個或更多點
| - 或者
[^a-zA-Z0-9.\s] - 除 ASCII 字母、數字、任何空格或. 字符。

如何使用正則表達式擺脫重復的特殊字符？

問題描述

3 個解決方案

解決方案1
2 已采納 2022-09-14 09:20:44

解決方案2
1 2022-09-14 09:28:17

解決方案3
0 2022-09-14 09:26:21

如何使用正則表達式擺脫重復的特殊字符？

問題描述

3 個解決方案

解決方案1 2 已采納 2022-09-14 09:20:44

解決方案2 1 2022-09-14 09:28:17

解決方案3 0 2022-09-14 09:26:21

解決方案1
2 已采納 2022-09-14 09:20:44

解決方案2
1 2022-09-14 09:28:17

解決方案3
0 2022-09-14 09:26:21