如何在 Python 中的兩個標記之間多次獲取 substring？

Question

我有以下代碼：

s = '''alt="Thunder Force"/>ehkjehkljhiflealt="Godzilla vs. Kong"/>'''

for i in s:
    start = s.find('alt="') + len('alt="')
    end = s.find('"/>')
    substring = s[start:end]
    print(substring)

但它只打印了很多次“Thunder Force”。 我希望它找到“Thunder Force”和“Godzilla vs. Kong”並分別打印這兩個。 如何？

Answer 1

你可以使用正則表達式

import re
s = '''alt="Thunder Force"/>ehkjehkljhiflealt="Godzilla vs. Kong"/>'''
x = re.findall(r'alt="(.*?)"/>', s)
print(x)

output

['Thunder Force', 'Godzilla vs. Kong']

Answer 2

使用regex和re.findall()

s = '''alt="Thunder Force"/>ehkjehkljhiflealt="Godzilla vs. Kong"/>'''

print(re.findall(r'(?<=alt\=").*?(?="/>)', s))
#['Thunder Force', 'Godzilla vs. Kong']

Answer 3

這是一個非正則表達式解決方案，看起來更像我認為您嘗試通過發布的嘗試實現的目標：

start = 0
while True:
    start = s.find('alt="', start)
    if start == -1:
        break
    start += len('alt="')
    end = s.find('"/>', start)
    if end == -1:
        break
    substring = s[start:end]
    start = end
    print(substring)

Answer 4

您還可以使用否定字符 class [^"]+來匹配除"之外的任何字符，如果要匹配至少一個字符，請重復 1 次以上。

如果空匹配也可以，您可以使用*而不是+ 。

import re
s = '''alt="Thunder Force"/>ehkjehkljhiflealt="Godzilla vs. Kong"/>'''
x = re.findall(r'alt="([^"]+)"/>', s)
print(x)

Output

['Thunder Force', 'Godzilla vs. Kong']

如何在 Python 中的兩個標記之間多次獲取 substring？

問題描述

4 個解決方案

解決方案1
1 已采納 2021-04-21 22:59:23

解決方案2
0 2021-04-21 22:59:09

解決方案3
0 2021-04-21 23:14:35

解決方案4
0 2021-04-21 23:21:44

如何在 Python 中的兩個標記之間多次獲取 substring？

問題描述

4 個解決方案

解決方案1 1 已采納 2021-04-21 22:59:23

解決方案2 0 2021-04-21 22:59:09

解決方案3 0 2021-04-21 23:14:35

解決方案4 0 2021-04-21 23:21:44

解決方案1
1 已采納 2021-04-21 22:59:23

解決方案2
0 2021-04-21 22:59:09

解決方案3
0 2021-04-21 23:14:35

解決方案4
0 2021-04-21 23:21:44