繁体   English   中英

如何在 Python 中绕过 BeautifulSoup 的 Recaptcha?

[英]How to bypass Recaptcha for BeautifulSoup in Python?

我希望使用BeautifulSoup ( BS4 ) 从https://www.example.com获取数据

req = requests.get('https://www.example.com/')
soup = BeautifulSoup(req.text, "lxml")
cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
    'table',attrs={"id" : "main_table_countries_today"}).find_all('tr')

我发现一个错误

cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
AttributeError: 'NoneType' object has no attribute 'find'

我在调试soup的时候,发现其实是显示被Cloudflarerecaptcha页面卡住了。

我检查了其他类似的问题,但发现大多数问题的答案为零。 已经回答了一个(2 个回复)以检查与我的查询无关的特定机器人测试。 因此,我认为这个问题一定不能标记为重复问题。

请告诉我如何绕过 recaptcha 获取分析数据。 顺便说一下,我在 ubuntu 的 google chrome 中使用 privacypass。谢谢。

尝试更改用户代理 header。例如,它可以与 curl 一起使用,因此没有任何高级保护。

我希望使用BeautifulSoup ( BS4 ) 从https://www.example.com获取数据

req = requests.get('https://www.example.com/')
soup = BeautifulSoup(req.text, "lxml")
cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
    'table',attrs={"id" : "main_table_countries_today"}).find_all('tr')

我发现一个错误

cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
AttributeError: 'NoneType' object has no attribute 'find'

当我调试soup时,我发现它实际上显示它被Cloudflarerecaptcha页面卡住了。

我检查了其他类似的问题,而我发现大多数问题的答案都是零。 已回答一个(2 个答复)以检查与我的查询无关的特定机器人测试。 因此,我认为这个问题不能被标记为重复问题。

请告诉我如何绕过 recaptcha 获取分析数据。 顺便说一句,我在 ubuntu 的谷歌浏览器中使用了隐私密码。 谢谢。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM