簡體   English   中英

通過python解析來自網站的信息

[英]Parse information from a website through python

我正在嘗試將一個網站上的數字讀入一個變量中。 編號所在的源代碼如下所示:

<tr bgcolor="#ccffff"><td>N_300_0</td><td>5918.720</td></tr>

該網站將始終顯示 N_300_0,但數字會發生變化。

到目前為止,我有:

link = urllib2.urlopen("http://www.example.com").read()
matches = re.findall('N_300_0', link);
number = ....

如何將數字放入變量中?

如果你正在做任何嚴肅的或涉及到的抓取,我強烈同意像BeautifulSoup這樣的東西是一個更好的方法。

但是要回答您的問題,您需要通過parens在python regex中使用分組來進行您想要的那種捕獲,例如

numbers = re.findall('N_300_0</td><td>([-+]?\d*\.\d+|\d+)',s)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM