捕獲第一個單詞和最后一個單詞的首字母的正則表達式

Question

我是正則表達式的新手，我試圖弄清楚如何在數據框中生成一個新列以捕獲名稱的首字母縮寫和姓氏。

例子df ：

Name           NormName
john smith     j smith
s r peterson   s peterson
sandra oh      s oh

這是我到目前為止嘗試過的代碼，但似乎無法使其正常工作。 我不知道如何僅替換中間部分。

namereg = re.compile('(^[a-z])(.*)(\s[a-z]*$)')
names['NormName'] = names.Name.apply(lambda tmp: namereg.sub('',tmp))

Answer 1

我認為您甚至不需要使用正則表達式：

names['NormName'] = names.Name.apply(lambda tmp: tmp[0]+" "+tmp.rpartition(" ")[2])

Answer 2

這應該可以，請根據需要進行調整。

import re
name="john smith"
PATTERN=r'^(\w).*(\s+\w+)$'
MATCH=re.search(PATTERN, name)
print(MATCH.group(1)+MATCH.group(2)

Answer 3

您可以使用

names['NormName'] = names['Name'].str.replace(r'^([a-z]).*\s([a-z]+)$', r'\1 \2')

參見regex演示。

圖案細節

^ -字符串的開頭
([az]) -組1（在替換模式中用\\1占位符表示）：一個小寫ASCII字母
.*\\s最多0個字符，直到最后一個空格
([az]+) -第2組（在替換模式中用\\2占位符表示）：...處的1+小寫ASCII字母...
$ -字符串的結尾。

Python演示：

>>> names['NormName'] =  names['Name'].str.replace(r'^([a-z]).*\s([a-z]+)$', r'\1 \2')
>>> names
           Name    NormName
0    john smith     j smith
1  s r peterson  s peterson
2     sandra oh        s oh

Answer 4

嘗試使用re.sub。 這里的第一個字母^（\\ w），最后一個單詞（\\ b \\ w + \\ b $）。

df['NormName']=df.Name.apply(lambda x: re.sub(r'^(\w).*(\b\w+\b$)',r'\1 \2',x))

捕獲第一個單詞和最后一個單詞的首字母的正則表達式

問題描述

4 個解決方案

解決方案1
5 已采納 2018-06-06 08:40:33

解決方案2
1 2018-06-06 08:53:43

解決方案3
0 2018-06-06 08:39:09

解決方案4
0 2018-06-06 12:19:03

捕獲第一個單詞和最后一個單詞的首字母的正則表達式

問題描述

4 個解決方案

解決方案1 5 已采納 2018-06-06 08:40:33

解決方案2 1 2018-06-06 08:53:43

解決方案3 0 2018-06-06 08:39:09

解決方案4 0 2018-06-06 12:19:03

解決方案1
5 已采納 2018-06-06 08:40:33

解決方案2
1 2018-06-06 08:53:43

解決方案3
0 2018-06-06 08:39:09

解決方案4
0 2018-06-06 12:19:03