[英]Rails & Javascript: strange 404s… perhaps a crawler?
這可能是一個模糊的問題,但似乎某個機器人正在抓取我的網站,並且做得很差。 看來是在從我的應用程序js文件中猜測ID,並將其放入網址中,例如:
Couldn't find Post with id=keypress
更奇怪的是,HTTP Referrer被列為application.js。
有誰之前經歷過這個嗎? 關於如何阻止這些爬蟲的任何想法?
如果它是合法的搜尋器,則可以通過將robot.txt文件放在根域目錄中來停止它-http: //en.wikipedia.org/wiki/Robots_exclusion_standard
您將在robots.txt文件中包含以下文本:
User-agent: *
Disallow: /YOUR_PATH_TO_FILE/application.js
您還可以將此標簽添加到頁面標題中:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果它是惡意爬網程序,那么這當然不會阻止它。 對於搜尋器,您可以采用其他方法,這些方法不遵守robots.txt,但這取決於您所使用的Web服務器。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.