通過python解析來自網站的信息

Question

我正在嘗試將一個網站上的數字讀入一個變量中。 編號所在的源代碼如下所示：

<tr bgcolor="#ccffff"><td>N_300_0</td><td>5918.720</td></tr>

該網站將始終顯示 N_300_0，但數字會發生變化。

到目前為止，我有：

link = urllib2.urlopen("http://www.example.com").read()
matches = re.findall('N_300_0', link);
number = ....

如何將數字放入變量中？

Answer 1

如果你正在做任何嚴肅的或涉及到的抓取，我強烈同意像BeautifulSoup這樣的東西是一個更好的方法。

但是要回答您的問題，您需要通過parens在python regex中使用分組來進行您想要的那種捕獲，例如

numbers = re.findall('N_300_0</td><td>([-+]?\d*\.\d+|\d+)',s)