繁体   English   中英

CasperJS和PhantomJS触发“站点离线”浏览器没有

[英]CasperJS and PhantomJS trigger “site is offline” browser doesn't

所以我试图刮一个网站( https://shop.advanceautoparts.com/ ),我可以通过CasperJS在过去几周内正常访问它。 当我现在尝试这样做时(就像2天前一样)我收到一条奇怪的消息,说该网站处于离线状态:

在此输入图像描述

当我试用普通浏览器或PhantomJS时,我得到了正常的网站。 我尝试在不同的计算机上进行,更改我的IP,更改用户代理但没有任何作用。

编辑

在PhantomJS上尝试相同的事情后,运行代码大约5次后我得到了相同的消息。 这是网站为防止刮擦而做的事吗?

我怀疑该网站知道你正在根据你的用户代理抓取,因为你多次打它

也许尝试随意使用你的用户,看看会发生什么。 见这里的清单

 
 
 
  
  var casper = require('casper').create({ pageSettings: { userAgent: "USE SOME OTHER USER AGENT HERE" } });
 
  

但是,在多个同时请求之后,该站点也可能被IP地址阻止。 因此,请尝试a)减慢脚本速度或b)导航到不同的页面

编辑

我把一个测试脚本拼凑起来,一切都适合我。 重要的是:

casper.waitUntilVisible("#header-top", function() {

在此输入图像描述

HTH

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM