使用Python 2从网站抓取数据

Question

我试图从股市中获取数据，但打印数据时却一无所获。 我要苹果的价格。

import urllib
import re



htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL&q1=1")

htmltext = htmlfile.read()

regex = '<span class="Fw(b) Fz(36px) Mb(-4px)" data-reactid="270">(.+?)</span>'

pattern = re.compile(regex)

price = re.findall(pattern,htmltext)

print price

Answer 1

您能否详细说明您要从页面中提取什么？ 我能够使用下面的代码来提取您的标签（注意：我建议使用Python 3，BeautifulSoup和请求，所有这些都建议用于网络抓取；另外，为了找出需要为headers变量添加的内容，我建议： http： //www.whatsmyua.com/ ）

import requests
from bs4 import BeautifulSoup

url = 'http://finance.yahoo.com/q?s=AAPL&q1=1'

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; InfoPath.3; .NET4.0C; .NET4.0E; rv:11.0) like Gecko'}

r = requests.get(url, headers=headers)

soup = BeautifulSoup(r.text, "html.parser")

for item in soup.find_all('span', {"class":"Fw(500) Pstart(10px) Fz(24px) C($dataRed)"}):
    print(item)

使用Python 2从网站抓取数据

问题描述

1 个解决方案

解决方案1
0 2017-01-20 00:28:03

使用Python 2从网站抓取数据

问题描述

1 个解决方案

解决方案1 0 2017-01-20 00:28:03

解决方案1
0 2017-01-20 00:28:03