簡體   English   中英

如何在python中使用正則表達式從html提取價格

[英]How to extract the price from html using regex in python

我有一個包含以下內容的html輸出:

<span class="value">
            Price:<br>
            <span style="color:white">23,07€ </span>
        </span>

我嘗試使用以下方法提取價格:

prices = re.findall(r'<span class="value">.*?(\d{1,3}\.?\d{1,2}).*?</span>',search_result)

有時將小數替換為-當有00時,我還需要此2個數字,這些數字由表達式23 07連接2307提取

感謝您的時間。

從索引1獲取匹配的組。

(?<=>)(\d[^€]*)

演示


或為每個數字獲取匹配的組索引1和2

(?<=>)(\d+)\D(\d+)\D

演示


如果您只對<span>標簽感興趣,請嘗試以下正則表達式

<span [^>]*>(\d+)\D(\d+)\D[^<]*

演示

樣例代碼:

import re
p = re.compile(ur'<span [^>]*>(\d+)\D(\d+)\D[^<]*')
test_str = u"..."

re.findall(p, test_str)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM