![](/img/trans.png)
[英]AttributeError: 'NoneType' object has no attribute 'get_text' python web-scraping
[英]AttributeError: 'NoneType' object has no attribute 'get_text' in beautifulsoop web-scraping
我正在做一个在 python 中使用 beautifulsoop(web scraping) 的项目。 早些时候,该程序运行良好且完美。 但是,现在它给出了如下所示的错误。 可能是网站的 html 结构会发生变化。 但我仍然无法找出错误并解决它。 请帮忙!!!
该网站是 - [https://covidindia.org/][1]
请帮我解决错误。
错误-
Traceback (most recent call last):
File "t1.py", line 112, in <module>
mainLabel = tk.Label(root, text=get_corona_detail_of_india(), font=f, bg='light blue',fg='red')
File "t1.py", line 23, in get_corona_detail_of_india
total_cases = soup.find("div",class_="elementor-element elementor-element-aceece0 elementor-widget elementor-widget-heading",).get_text()
AttributeError: 'NoneType' object has no attribute 'get_text
我的代码-
URL = 'https://covidindia.org/'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
#print(soup)
total_cases = soup.find("div",class_="elementor-element elementor-element-aceece0 elementor-widget elementor-widget-heading",).get_text()
tc=(total_cases.strip())
同样,当我提取汤时,o/p 是-
<html><head><title>403 Forbidden</title></head>
<body>
<center><h1>403 Forbidden</h1></center>
<hr/><center>nginx</center>
我的访问是永久禁止的吗??
向您的请求添加user-agent
标头。 当您不添加user-agent
,网站会将您检测为机器人,因此不会让您访问网站的内容。 这是完整的代码:
from bs4 import BeautifulSoup
import requests
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:32.0) Gecko/20100101 Firefox/32.0'}
URL = 'https://covidindia.org/'
page = requests.get(URL,headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
#print(soup)
total_cases = soup.find("div",class_="elementor-element elementor-element-aceece0 elementor-widget elementor-widget-heading",).get_text()
tc=(total_cases.strip())
输出:
>>> tc
'Total Cases - 83,14,673 (+46,171)'
当站点需要一个您没有放入请求中的对象时,会发生此问题,检查站点需要什么,它可能是其他用户回答的用户代理或其他一些东西。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.