簡體   English   中英

大型數據庫中的數據關聯

[英]Data Correlation in large Databases

我們正在嘗試確定整個企業中存儲的某些信息的位置,以使其符合我們的數據政策。 在文件端,我們使用Nessus來搜索不同的文件,但是我想知道在數據庫端。

使用Nessus似乎毫無意義,因為它會輸出原始數據,並且不會告訴我們它位於哪個表或行中,也不會給我們提供很多有用的信息,特別是考慮到這些數據庫非常大(數百GB)。

同樣值得注意的是,該系統需要能夠進行基於模式的匹配(例如使用正則表達式)。 不只是“啞搜索”引擎。

我已經研究了使用數據挖掘和數據倉庫來查找此數據,但似乎它們更多地用於數據分析,而不僅僅是查找數據。

有沒有更好的方法來搜索數據庫中的大量數據以嘗試查找此信息? 我們同時使用Oracle 11g和SQL Server 2008,並且都需要對它們進行搜索,因此我想避免使用特定於服務器的范例(盡管如果我必須重寫一些代碼以將T-SQL轉換為PL / SQL,反之亦然,我不介意)

在用於搜索大量文本的SQL Server上,可以查看“全文本搜索”。

在此處了解更多信息http://msdn.microsoft.com/en-us/library/ms142559.aspx

但是,如果我沒看錯的話,您希望以與網絡搜索引擎蜘蛛化網站和網頁類似的方式擴展數據庫。

您可以使用一組全文查詢來帶回跨越多個表的結果。

Oracle通過RegExp_Like()函數支持正則表達式,並且應該非常簡單明了,可以根據系統元數據自動生成所需的代碼(例如,查找一定長度的所有文本列,並將它們包括在謂詞中)再次在該表中查找與您的正則表達式匹配的行和值)。 聽起來確實沒有太大挑戰。 從理論上講,您可以檢查約束列,以防止插入與正則表達式匹配的值,但是這可能會導致過度殺傷。

Oracle Text適用於搜索數據庫中存儲的大量文本(例如PDF,HTML,TXT或DOC)中的單詞/詞組。 有一些有限的模糊搜索,但本身沒有正則表達式。

您實際上並不需要進入要查找的數據類型或數據庫中的數據。 Nessus表示您正在尋找安全問題,但是“數據關聯”的標題表示完全不同的東西。

確實,數據結構應提供有關查找內容和位置的信息。 這就是數據庫的意義-為可訪問性構建數據。 支持CMS,論壇軟件或類似軟件的數據庫將是一團糟。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM