繁体   English   中英

使用Python 2从网站抓取数据

[英]Scraping data from a website using Python 2

我试图从股市中获取数据,但打印数据时却一无所获。 我要苹果的价格。

import urllib
import re



htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL&q1=1")

htmltext = htmlfile.read()

regex = '<span class="Fw(b) Fz(36px) Mb(-4px)" data-reactid="270">(.+?)</span>'

pattern = re.compile(regex)

price = re.findall(pattern,htmltext)

print price

您能否详细说明您要从页面中提取什么? 我能够使用下面的代码来提取您的标签(注意:我建议使用Python 3,BeautifulSoup和请求,所有这些都建议用于网络抓取;另外,为了找出需要为headers变量添加的内容,我建议: http: //www.whatsmyua.com/

import requests
from bs4 import BeautifulSoup

url = 'http://finance.yahoo.com/q?s=AAPL&q1=1'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; InfoPath.3; .NET4.0C; .NET4.0E; rv:11.0) like Gecko'}

r = requests.get(url, headers=headers)

soup = BeautifulSoup(r.text, "html.parser")

for item in soup.find_all('span', {"class":"Fw(500) Pstart(10px) Fz(24px) C($dataRed)"}):
    print(item)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM