簡體   English   中英

如何在Apache下阻止我的網站上的mp3抓取工具?

[英]How can I block mp3 crawlers from my website under Apache?

有沒有辦法阻止使用.htaccess文件或類似文件從引用者訪問? 我的帶寬被http://www.dizzler.com推薦的人吃掉了這是一個基於Flash的網站,允許你瀏覽一個已爬行的公共mp3的庫。

編輯: Dizzler仍然進入(可能在所有情況下都沒有指示引用者)所以我將所有的mp3移動到新文件夾,禁用目錄瀏覽,並創建了一個robots.txt文件(希望)不會被索引再次。 接受的答案改為反映我之前嘗試的徒勞:P

這就像是說你想阻止垃圾郵件機器人在公開可見的頁面上收集電子郵件 - 很難說出用戶和機器人之間的區別而不強迫觀眾登錄以確認他們的身份。

您可以使用robots.txt來禁止實際遵循這些規則的蜘蛛,但這是他們的一方,而不是您的服務器。 有一個頁面解釋了如何捕獲那些違反規則並明確禁止它們的頁面: 使用Apache來阻止壞機器人 [evolt.org]

如果你想要一個簡單的方法來停止使用.htaccess的dizzler,你應該能夠打開它並添加:

<Directory /directoryName/subDirectory>
Order Allow,Deny
Allow from all
Deny from 66.232.150.219
</Directory>

這個站點 :(把它放在你的.htaccess文件中)

RewriteEngine on
RewriteCond %{HTTP_REFERER} ^http://((www\.)?dizzler\.com [NC]
RewriteRule .* - [F]

你可以用類似的東西

SetEnvIfNoCase Referer dizzler.com spammer=yes

Order allow,deny
allow from all
deny from env=spammer

資料來源: http//codex.wordpress.org/Combating_Comment_Spam/Denying_Access

這不是一個非常優雅的解決方案,但您可以阻止該網站的抓取機器人,然后重命名您的mp3文件以打破網站上已有的鏈接。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM