在 email 開始之前獲取所有電子郵件和消息

Question

我正在嘗試解析我的數據集以獲取 email 之前的所有電子郵件和單詞。 例如，如果我有這樣的一行：

sno                                                text
1        From: m.kro@b.org To: Cha.Sh@dys.com Hi my name is Sam and my email is samwise@gmail.com

然后我想將其捕獲為：

sno                                                text                                              emails
1        From: m.kro@b.org To: Cha.Sh@dys.com Hi my name is Sam and my email is samwise@gmail.com    [From : m.kro@b.org ,To: Cha.Sh@dys.com, is samwise@gmail.com]

到目前為止我嘗試過的解決方案：

我已經嘗試使用“find_all”function 來獲取所有電子郵件，但是在 email 開始之前我遇到了問題。

df['Full Comments'].str.findall('(\S+@\S+)').str[0]

對此的任何幫助表示贊賞。 謝謝你。

Answer 1

嘗試：

pat = '([\w:]+ [\w\.]+@[\w\.]+)'

df['emails'] = df.text.str.extractall(pat).groupby(level=0)[0].agg(list)

更新：您可以使用unstack將單詞提升為列標題：

emails = (df.text.str.extractall(pat)
       .reset_index('match', drop=True)
       .set_index([0],append=True)[1]
       .unstack()
    )

df = df.join（電子郵件）

Output（不含連接部分）：

0       From:             To:                 is 
0  m.kro@b.org  Cha.Sh@dys.com  samwise@gmail.com

在 email 開始之前獲取所有電子郵件和消息

問題描述

1 個解決方案

解決方案1
1 已采納 2020-12-21 19:56:02

在 email 開始之前獲取所有電子郵件和消息

問題描述

1 個解決方案

解決方案1 1 已采納 2020-12-21 19:56:02

解決方案1
1 已采納 2020-12-21 19:56:02