找到合適的正則表達式

Question

您能幫我在Margaux頁的每次中找到正確的正則表達式來提取（ Margaux或Saint-Julien ）：

第1頁： Margaux, Rouge

在第2頁中： 2ème Vin, Saint-Julien, Rouge

我的代碼：

item ["appelation"] = res.select('.//div[@class="pro_col_right"]/div[@class="pro_blk_trans"]/div[@class="pro_blk_trans_titre"]/text()').re(r'\s*\w+\-\w+\-\w+|\w+\-\w+|\[^Rouge,Blanc]')

我的正則表達式找不到Margaux，但它提取了Saint-Julien！

Answer 1

不知道為什么您需要它，但是假設s是您的html文件，那么此正則表達式將找到您想要的東西。

import re
m = re.search(r"\<div\ class=\"pro_blk_trans_titre\"\>(.*)\</div\>", s)
print(m.group(1).strip().encode("utf8"))

# page1: b'Margaux, Rouge'
# page2: b'2\xc3\xa8me Vin, Saint-Julien, Rouge'

找到合適的正則表達式

問題描述

1 個解決方案

解決方案1
0 2013-07-25 12:42:31

找到合適的正則表達式

問題描述

1 個解決方案

解決方案1 0 2013-07-25 12:42:31

解決方案1
0 2013-07-25 12:42:31