使用 Python 正則表達式匹配字母數字單詞、提及或電子郵件

Question

我已經讀過這個，這個，這個以及很多其他的。 他們不回答我的問題。

我想過濾一個字符串，它可能包含以“@”開頭的電子郵件或字符串（如電子郵件，但在“@”之前沒有文本）。 我已經測試了很多，但開始接近的最簡單的方法之一是：

import re
re.split(r'(@)', "test @aa test2 @bb @cc t-es @dd-@ee, test@again")
Out[40]: 
['test ', '@', 'aa test2 ', '@', 'bb ', '@', 'cc t-es ', '@', 'dd-', '@', 'ee, test', '@', 'again']

我正在尋找可以給我的正確正則表達式：

['test ', '@aa', 'test2 ', '@bb ', '@cc', 't-es ', '@dd-', '@ee', 'test@again']

Answer 1

當您可以“喲正則表達式，給我所有匹配項”時，為什么要嘗試拆分：

test = "test @aa test2 @bb @cc t-es @dd-@ee, test@again"


import re

print(
    re.findall("[^\s@]*?@?[^@]* |[^@]*@[^\s@]*", test)
)
# ['test ', '@aa test2 ', '@bb ', '@cc t-es ', '@dd-', '@ee, ', 'test@again']

我試過了，但我不能讓正則表達式更小，但至少它有效，而且誰希望正則表達式很小

根據 OP 的新要求（或更正的要求）

[^\s@]*?@?[^\s@]* |[^@]*@[^\s@]*

Answer 2

我自己的基於不同電子郵件解析+簡單“ @[:alphanum:]+ ”解析的解決方案是：

USERNAME_OR_EMAIL_REGEX = re.compile(
    r"@[a-zA-Z0-9-]+"  # simple username
    r"|"
    r"[a-zA-Z0-9.!#$%&'*+/=?^_`{|}~-]+"  # email 
    r"@"  # following: domain name:
    r"[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?"
    r"(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)")

使用 Python 正則表達式匹配字母數字單詞、提及或電子郵件

問題描述

2 個解決方案

解決方案1
1 2019-05-24 09:12:19

解決方案2
0 已采納 2019-05-24 13:07:20

使用 Python 正則表達式匹配字母數字單詞、提及或電子郵件

問題描述

2 個解決方案

解決方案1 1 2019-05-24 09:12:19

解決方案2 0 已采納 2019-05-24 13:07:20

解決方案1
1 2019-05-24 09:12:19

解決方案2
0 已采納 2019-05-24 13:07:20