繁体   English   中英

CasperJS:亚马逊无限Captcha登录

[英]CasperJS: Amazon infinite Captcha Login

我正在使用Casperjs登录我的亚马逊帐户并检索一些数据。

但偶尔我会在登录时获得Captchas。 所以casperjs向我显示验证码,我手动返回解决方案,以便它可以提交表单。

问题是CasperJS立即获得另一个验证码,这次更难。 我也解决了这个问题,但是另一个验证码出现......等等......

我没有做任何特别的事情,只有一些casperjs填写并点击。 Casperjs在页面中加载带有验证码解决方案的外部js文件,然后提交。

我确信正确的验证码是提交的。 亚马逊如何确保陷入无限循环?

从他们的角度考虑它的外观。 他们可以告诉机器人根据鼠标和键盘交互访问您的帐户。 在搜索登录按钮时,人类将扫描页面并随机移动鼠标。 您的脚本直接跳转到单击选择器。

当验证码出现时,你填写它。这并不能证明你是一个人。 这简单地证明了你的机器人可以提醒你一个人类填写的验证码。其余的交互都是由机器人完成的,亚马逊完全意识到这一点。 您可以根据需要回答尽可能多的验证码,但要实现这一目标的交互仍然会被标记为机器人。

您可能想要沿着不同的路线前进,例如使用cookie来启动与您的帐户已登录的CasperJS会话。或者,亚马逊是否提供任何类型的API来提取您感兴趣的价值?

他们会阻止你的机器人脱离天才的爱和关心,如果这让你感觉更好!

不幸的是,这不是一门精确的科学,所以可能没有一般的,持久的解决方案。 Amazon.com使用不同的技术来检查您是否是机器人,包括浏览器指纹识别,cookie挑战和用户行为分析(鼠标移动等)。

我会首先尝试随机化用户代理的某些部分,但只是看看是否有效。 我还会尝试像Chromium这样的完整无头浏览器,使用Selenium允许脚本与它交谈。

我可以询问您试图抓取帐户的频率吗? 我认为如果你每天都做那件事,那应该不是什么大问题。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM