Python 正則表達式 - 如何考慮行尾和文件尾並僅打印字符串的子部分？

Question

我有一個由 A、B 或 C 字母指示的名稱列表和分配給它們的組。 我想要做的是返回 A 組的所有成員。

我正在使用正則表達式查找以 A 結尾的所有行，然后我需要打印這些人的姓名，不包括組（A、B、C）

我遇到了幾個問題：

最后一個條目在 A 組中，但是這不是行尾而是文件尾並且被忽略。
一些記錄在行尾指示符之前包含一個空格，並且正在被傳遞。
我只想打印名稱而不是組。

代碼

import re


   
test_str = ("John Doe: A\n"
    "Jane Washington: B\n"
    "Geoffrey Grupp: A \n"
    "Joseph Rose: A\n"
    "Victoria Georges: C \n"
    "Simon Murphy: A")

regex = r"^.*[A]$\n"    
result= re.findall(regex, test_str, re.MULTILINE)
result

Output

Out[8]: ['John Doe: A\n', 'Joseph Rose: A\n']

如您所見，我想念 Geoffrey Grupp 和 Simon Murphy。 此外，我不想在每個名稱后打印“：A”。

Answer 1

你可以試試：

import re

test_str = ("John Doe: A\n"
    "Jane Washington: B\n"
    "Geoffrey Grupp: A \n"
    "Joseph Rose: A\n"
    "Victoria Georges: C \n"
    "Simon Murphy: A")

regex = r"^(.*): A *$"     
result= re.findall(regex, test_str, re.MULTILINE)
print(result)

它給：

['John Doe', 'Geoffrey Grupp', 'Joseph Rose', 'Simon Murphy']

解釋：

'(.*)'是一個捕獲組 - 將返回的模式部分；
' *'匹配A和行尾之間可能存在的空格字符。

Python 正則表達式 - 如何考慮行尾和文件尾並僅打印字符串的子部分？

問題描述

代碼

Output

1 個解決方案

解決方案1
3 已采納 2021-03-01 03:08:50

Python 正則表達式 - 如何考慮行尾和文件尾並僅打印字符串的子部分？

問題描述

代碼

Output

1 個解決方案

解決方案1 3 已采納 2021-03-01 03:08:50

解決方案1
3 已采納 2021-03-01 03:08:50