[英]CasperJS and PhantomJS trigger “site is offline” browser doesn't
所以我试图刮一个网站( https://shop.advanceautoparts.com/ ),我可以通过CasperJS在过去几周内正常访问它。 当我现在尝试这样做时(就像2天前一样)我收到一条奇怪的消息,说该网站处于离线状态:
当我试用普通浏览器或PhantomJS时,我得到了正常的网站。 我尝试在不同的计算机上进行,更改我的IP,更改用户代理但没有任何作用。
编辑
在PhantomJS上尝试相同的事情后,运行代码大约5次后我得到了相同的消息。 这是网站为防止刮擦而做的事吗?
我怀疑该网站知道你正在根据你的用户代理抓取,因为你多次打它
也许尝试随意使用你的用户,看看会发生什么。
(
见这里的清单 )
var casper = require('casper').create({ pageSettings: { userAgent: "USE SOME OTHER USER AGENT HERE" } });
但是,在多个同时请求之后,该站点也可能被IP地址阻止。
因此,请尝试a)减慢脚本速度或b)导航到不同的页面
编辑
我把一个测试脚本拼凑起来,一切都适合我。 重要的是:
casper.waitUntilVisible("#header-top", function() {
HTH
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.