繁体 English 中英

如何防止滥用抓取工具抓取部署在Heroku上的rails应用程序？

[英]How to prevent abusive crawlers from crawling a rails app deployed on Heroku?

原文 2011-04-21 06:01:38 1 1 ruby-on-rails/ heroku/ robots.txt

我想限制爬虫访问我在Heroku上运行的rails应用程序。 如果我使用Apache OR nginX，那将是一项直接的任务。 由于应用程序部署在Heroku上，我不确定如何限制HTTP服务器级别的访问。

我曾尝试使用robots.txt文件，但有问题的抓取工具不尊重robot.txt。

这些是我正在考虑的解决方案：

1）rails层中的before_filter限制访问。

2）基于机架的解决方案来限制访问

我想知道是否有更好的方法来解决这个问题。

1 个解决方案

我读过有关蜜罐解决方案的内容：您有一个不能被抓取的URI（将其放在robots.txt中）。 如果任何IP调用此URI，则阻止它。 我将它实现为Rack中间件，因此点击不会转到完整的Rails堆栈。

对不起，我用Google搜索，但找不到原始文章。

Heroku Rails应用程序找不到爬虫的视图

[英]Heroku Rails App Can't Find Views For Crawlers

将Rails应用程序部署到Heroku无法正常工作

[英]Deployed rails app to Heroku not working

如何在Heroku Rails应用程序中显示“上次部署”的时间戳？

[英]How can I display a 'last-deployed' timestamp from within my Heroku Rails app?

如何将部署的 rails 应用程序连接到现有的 Heroku 数据库

[英]How connect deployed rails app to exist Heroku database

可以在不使用Heroku Toolbelt的情况下部署Rails应用程序吗？如果是这样，怎么样？

[英]Can a Rails app be deployed without using Heroku Toolbelt? If so, how?

如何删除部署在heroku上的Rails应用程序中的缓存页面

[英]how to delete cached page in rails app deployed on heroku

如何使用git复制rails app并部署到heroku

[英]How to copy rails app using git and deployed to heroku

如何让rufus-scheduler使用部署到Heroku的Rails应用程序？

[英]How to get rufus-scheduler working with a Rails app deployed to Heroku?

如何让用户在Heroku上部署的Rails应用程序中创建计划任务

[英]How to have users create scheduled tasks in rails app deployed on Heroku

已经部署到Heroku的Rails应用程序无法更新

[英]Rails app already deployed to Heroku cannot be updated

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Heroku Rails应用程序找不到爬虫的视图将Rails应用程序部署到Heroku无法正常工作如何在Heroku Rails应用程序中显示“上次部署”的时间戳？如何将部署的 rails 应用程序连接到现有的 Heroku 数据库可以在不使用Heroku Toolbelt的情况下部署Rails应用程序吗？如果是这样，怎么样？如何删除部署在heroku上的Rails应用程序中的缓存页面如何使用git复制rails app并部署到heroku 如何让rufus-scheduler使用部署到Heroku的Rails应用程序？如何让用户在Heroku上部署的Rails应用程序中创建计划任务已经部署到Heroku的Rails应用程序无法更新

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM