繁体   English   中英

无法从Python的HTML站点获取特定数据(3.6)

[英]Can't get specific data from a HTML site in Python (3.6)

网页(关于足球和收视率):

http://www.fantagazzetta.com/voti-serie-a

我试过的

如何从HTML页面提取文本?

我尝试在用户答案中使用用户JRodDynamite提供的代码(最后只是打印res而没有做for事情)。 所以我只需要编辑这部分代码(我想):

res = soup.findAll("article", {"class": "listingItem"})

要打印每个表的内容,我认为答案是:

res = soup.findAll("table", {"class": "table"})

但这没有打印任何内容。 所以,我需要您的帮助:我想从该网页上收集数据(玩家的姓名和评分),但我仍然坚持这一点。 谢谢

BeautifulSoup,请求等不执行Javascript,因此通过JS传递或呈现的任何数据将对您不可用。

对于JavaScript呈现的页面,您可以尝试使用dryscrape如下所示:

import dryscrape
from bs4 import BeautifulSoup

sess = dryscrape.Session()
sess.visit('http://www.fantagazzetta.com/voti-serie-a#')
s = BeautifulSoup(sess.body())
for a in s.find_all('table', {'class': 'table'}):
    print(a.text)

Dryscrape安装:

sudo pip install dryscrape

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM