[英]selenium phantomjs can't scrape a website bot detection
我无法抓住这个网站这里是python selenium phantomjs请求的截图。 我不知道他们是如何检测到它是一个机器人,但在图片上说需要javascript,需要验证码,也许还需要其他什么东西? 绝对不是因为这是我的第一次请求而不是超人速度,所以这不是原因。 PS当我在浏览器上粘贴相同的请求时,它指向我想要的页面并且工作正常。
br = webdriver.PhantomJS('bin/phantomjs')
br.set_window_size(1366, 200)
br.get("website")
br.save_screenshot(x)
好吧,我现在就开始工作了。 我会简单地把这个放在其他不这样做的人身上。 启用javascript和假的useragent
cap = webdriver.DesiredCapabilities.PHANTOMJS
cap["phantomjs.page.settings.javascriptEnabled"] = True
cap["phantomjs.page.settings.loadImages"] = True
cap["phantomjs.page.settings.userAgent"] = 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0'
br = webdriver.PhantomJS('bin/phantomjs',desired_capabilities=cap)
一般可以帮助的事情:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.