簡體   English   中英

防止數據竊取

[英]Preventing data stealing

我知道阻止人們竊取我們的數據是不可能的,但是我有一個大型數據庫,並且我至少要防止自動腳本竊取我的數據庫。

到目前為止,我的想法是:

  • 使用JavaScript或對HTML進行編碼=繁重並且可以輕松解碼
  • 重新搜索=沒辦法,用戶只會離開我的網站
  • 在網站HTML中插入隨機數據和標簽,以避免regex rip =好?

任何想法表示贊賞。

人們為什么要竊取您的數據庫? 為什么要這么做呢? 會問他們不夠嗎?

明確您的政策,並確保您的公司法律部門已經檢查了措辭。 通過明確禁止未經授權的聯合組織來阻止這種行為,並且您將采取法律措施加以阻止。

或者更好的是,鼓勵授權的聯合組織。 只有在沒有明智的方式以授權方式進行操作的情況下,人們才會進行未經授權的聯合組織。

技術措施可能會產生一些效果,但只會阻止那些沒有特別能力或決心的人。

您提出的所有解決方案均無效。 一個好的腳本編寫者可以輕松繞過那些腳本。 但是,在應用程序服務器端有一種技術解決方案:實施速率限制。 每10秒僅允許一次從給定IP地址進行一次搜索。 這將使從您的站點進行自動數據挖掘非常緩慢。

我認為Alexa在標記中插入了隨機標簽,這讓我有一段時間想嘗試挖掘它了……他們在Alexa排名中添加了一些額外的標簽,例如<span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span> ,除非您也下載了樣式表並查看了渲染規則,否則您將無法確定應該是的數字。

但是...如果我有足夠的耐心,我可以先“渲染”這些數字然后再進行挖掘,但這對我來說並不值得。 將頁面請求的數量限制在人為可能的范圍內可能效果很好(每分鍾50次左右)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM