[英]Parse information from a website through python
我正在嘗試將一個網站上的數字讀入一個變量中。 編號所在的源代碼如下所示:
<tr bgcolor="#ccffff"><td>N_300_0</td><td>5918.720</td></tr>
該網站將始終顯示 N_300_0,但數字會發生變化。
到目前為止,我有:
link = urllib2.urlopen("http://www.example.com").read()
matches = re.findall('N_300_0', link);
number = ....
如何將數字放入變量中?
如果你正在做任何嚴肅的或涉及到的抓取,我強烈同意像BeautifulSoup這樣的東西是一個更好的方法。
但是要回答您的問題,您需要通過parens在python regex中使用分組來進行您想要的那種捕獲,例如
numbers = re.findall('N_300_0</td><td>([-+]?\d*\.\d+|\d+)',s)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.