无法从Python的HTML站点获取特定数据（3.6）

Question

网页（关于足球和收视率）：

http://www.fantagazzetta.com/voti-serie-a

我试过的

如何从HTML页面提取文本？

我尝试在用户答案中使用用户JRodDynamite提供的代码（最后只是打印res而没有做for事情）。 所以我只需要编辑这部分代码（我想）：

res = soup.findAll("article", {"class": "listingItem"})

要打印每个表的内容，我认为答案是：

res = soup.findAll("table", {"class": "table"})

但这没有打印任何内容。 所以，我需要您的帮助：我想从该网页上收集数据（玩家的姓名和评分），但我仍然坚持这一点。 谢谢

Answer 1

BeautifulSoup，请求等不执行Javascript，因此通过JS传递或呈现的任何数据将对您不可用。

对于JavaScript呈现的页面，您可以尝试使用dryscrape如下所示：

import dryscrape
from bs4 import BeautifulSoup

sess = dryscrape.Session()
sess.visit('http://www.fantagazzetta.com/voti-serie-a#')
s = BeautifulSoup(sess.body())
for a in s.find_all('table', {'class': 'table'}):
    print(a.text)

Dryscrape安装：

sudo pip install dryscrape

无法从Python的HTML站点获取特定数据（3.6）

问题描述

1 个解决方案

解决方案1
1 已采纳 2017-01-10 18:26:03

无法从Python的HTML站点获取特定数据（3.6）

问题描述

1 个解决方案

解决方案1 1 已采纳 2017-01-10 18:26:03

解决方案1
1 已采纳 2017-01-10 18:26:03