簡體   English   中英

如何在Perl中索引一堆文件?

[英]How can I index a bunch of files in Perl?

我正在嘗試通過首先查找未引用的對象來清理數據庫。 我已經將所有數據庫對象提取到一個列表中,並且將所有ddl代碼提取到了文件中,我還擁有了該項目的所有Java源代碼。

基本上,我想做的事情(最好是在Perl中,因為它是我最熟悉的腳本語言)是以某種方式索引所有提取的數據庫ddl和Java文件的內容(以加快搜索速度),逐步遍歷數據庫對象列表,然后搜索所有文件(使用索引)以查看這些對象是否在任何地方被引用並創建報告。

如果您能為我指明正確的方向,以便找到一種可以對所有這些文件進行索引的索引,並且可以搜索它們(最好在Perl中),那么我將不勝感激。 此處的關鍵是能夠以編程方式執行此操作,而不是手動執行此操作(使用類似Google桌面搜索的操作)。

將任務分解為幾個步驟,並從頭開始。 首先,一條記錄是什么樣的,並且其中的哪些信息將其連接到另一條記錄? 解析該記錄,存儲其唯一標識符和所引用內容的列表。

獲得該列表后,將其反轉。 對於每個引用,創建一個引用對象的列表。 按其標識符計數。 您應該能夠得到計數為零的計數器。

這是一個非常籠統的答案,但是您問了一個非常籠統的問題。 如果遇到問題,請將其分解為其中一個步驟,並提出一個更具體的問題,提供示例數據和到目前為止已嘗試的代碼。

祝好運,

一個有趣的模塊,您可以用來做您想做的事情,是KinoSearch,它為您提供了您正在尋找的索引。 然后,您可以瀏覽對象標識符並檢查是否有對其的引用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM