[英]Is there any limit on redirects in StormCrawler?
我可以在_redirTo
的状态索引中看到_redirTo
标签。 有关重定向的几个问题如下:
_redirTo
标记中看到一个重定向,它是立即重定向。 如果URL有两个或三个重定向,则无法获得重定向计数? 您可以设置从种子开始的深度限制,请参见MaxDepth URL过滤器,但不能直接取决于连续重定向的数量。
如您所见,我们仅跟踪给定文档被重定向到的URL。
如果您想要控制重做的次数而不管与种子的距离如何,一种方法是扩展或修改MetadataTransfer或在协议实现中处理重做,其缺点是这将不会检查目标URL是否已经被拿来。
更新有一个名为'redirections.allowed'的配置元素,默认值为true。 我刚刚推送了针对SimpleFetcherBolt的修复程序,因为处理不正确。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.