如何不使用正则表达式捕获字符串

Question

我有这个字符串

<div class"ewSvNa"><a class="ugP" href="link">Description</a><span data-testid=""><small>$</small><span>0,00</span></div>

这个正则表达式/ewS.*?ugP\".*?f=\"(.*?)\">(.*?)<.*?<s.*?n>(.*?)</g . 结果是：

Group 1 = 'link'
Group 2 = 'Description'
Group 3 = '0,00'

我的问题是：第 3 组的结果可能像“$0,00”？

谢谢你们 =]]]]]

Answer 1

建议不要使用正则表达式来解析 HTML - 而是使用适当的解析器，例如Beautiful Soup 。

然后你的代码变成：

from bs4 import BeautifulSoup

text = '<div class"ewSvNa"><a class="ugP" href="link">Description</a><span data-testid=""><small>$</small><span>0,00</span></div>'
soup = BeautifulSoup(text)
amount = soup.select_one('span[data-testid]').get_text()
# '$0,00'

如何不使用正则表达式捕获字符串

问题描述

1 个解决方案

解决方案1
1 已采纳 2022-04-02 12:22:38

如何不使用正则表达式捕获字符串

问题描述

1 个解决方案

解决方案1 1 已采纳 2022-04-02 12:22:38

解决方案1
1 已采纳 2022-04-02 12:22:38