繁体   English   中英

Python BeautifulSoup-通过ID返回表'none'查找表

Python BeautifulSoup - find table by id returning 'none'

提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供   中文繁体   英文版本   中英对照 版本,有任何建议请联系yoyou2525@163.com。

由于某种原因,我无法通过ID查找表或通过ID选择表。.我一直在参考BS文档,据我所知它应该可以工作。

以下是尝试通过ID“ per_game”选择表的代码示例,content.find(id ='per_game')也不适合我。

我一直在参考文档的find和CSS选择器部分, 网址为https : //www.crummy.com/software/BeautifulSoup/bs4/doc/#find

import requests
import csv
import calendar
from datetime import date, datetime, timedelta
from collections import OrderedDict, defaultdict
from bs4 import BeautifulSoup as soup

season = str(date.today().year + 1)
month = calendar.month_name[date.today().month].lower()

teamUrl = "https://basketball-reference.com/teams/"

urls       =    [teamUrl + 'ATL/' + season +'.html'] # Atlanta Hawks
                 # teamUrl + 'BOS/' + season +'.html', # Boston Celtics
                 # teamUrl + 'BKN/' + season +'.html', # Brooklyn Nets
                 # teamUrl + 'CHA/' + season +'.html', # Charlotte Hornets

for url in urls:
    page = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
    content = soup(page.content, 'html.parser')
    table = content.select("#per_game")
    print(table)

非常感谢,OM。

1 个回复

这不是Ajax,只需从html中删除注释

page = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
html_doc = page.text.replace('<!--', '').replace('-->', '')
content = soup(html_doc, 'html.parser')
1 BeautifulSoup查找返回无

嗨,我正在尝试制作一个网络抓取工具,以查看某人何时上传视频,然后获取该视频的链接。 我想通过查看“ {time} old”是否小于上次运行的时间来获取最新的视频。 该脚本不断返回“ None”,但我实际上是盯着它在这里搜索我的代码的标记。 ...

2 BeautifulSoup find() 没有返回

输出总是: 标题: 无 Preis: 无 我之前已经检查过这些步骤,但是在到达 find 函数之前一切正常。 我以前从来没有问过一个问题,所以如果我犯了错误,请原谅我。 谢谢您的帮助。 ...

6 BeautifulSoup类找到返回无

我正在使用BeautifulSoup编写一个python程序,它将检索网站上的下载链接。 我使用find方法来检索链接所在的html类,但它返回None。 我已尝试使用父类访问此类,但未成功。 这是我的代码 同样,我希望下载链接位于btn-item download htm ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2021 STACKOOM.COM