[英]How can I convert a bunch of files from ISO-8859-1 to UTF-8 using Perl?
[英]How can I index a bunch of files in Perl?
我正在嘗試通過首先查找未引用的對象來清理數據庫。 我已經將所有數據庫對象提取到一個列表中,並且將所有ddl代碼提取到了文件中,我還擁有了該項目的所有Java源代碼。
基本上,我想做的事情(最好是在Perl中,因為它是我最熟悉的腳本語言)是以某種方式索引所有提取的數據庫ddl和Java文件的內容(以加快搜索速度),逐步遍歷數據庫對象列表,然后搜索所有文件(使用索引)以查看這些對象是否在任何地方被引用並創建報告。
如果您能為我指明正確的方向,以便找到一種可以對所有這些文件進行索引的索引,並且可以搜索它們(最好在Perl中),那么我將不勝感激。 此處的關鍵是能夠以編程方式執行此操作,而不是手動執行此操作(使用類似Google桌面搜索的操作)。
將任務分解為幾個步驟,並從頭開始。 首先,一條記錄是什么樣的,並且其中的哪些信息將其連接到另一條記錄? 解析該記錄,存儲其唯一標識符和所引用內容的列表。
獲得該列表后,將其反轉。 對於每個引用,創建一個引用對象的列表。 按其標識符計數。 您應該能夠得到計數為零的計數器。
這是一個非常籠統的答案,但是您問了一個非常籠統的問題。 如果遇到問題,請將其分解為其中一個步驟,並提出一個更具體的問題,提供示例數據和到目前為止已嘗試的代碼。
祝好運,
一個有趣的模塊,您可以用來做您想做的事情,是KinoSearch,它為您提供了您正在尋找的索引。 然后,您可以瀏覽對象標識符並檢查是否有對其的引用。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.