[英]Is there a module for searching in msword doc-files on linux?
通常我正在使用grep -r --color word /path/dir
搜索,但這對二進制文件不起作用。 所以我想編寫一個類似的Perl腳本。 因此,我正在搜索一個可以在Linux機器上讀取doc文件的模塊(可能類似於Spreadsheet :: ParseExcel for ms-word-documents)。
有很多單詞到文本轉換器(如antidoc,wv,catdoc,unoconv ......)。 你可以通過他們的輸出grep。 這也是msysgit對doc文件編目的作用。
不試圖聽起來很諷刺,這是使用閉源專有文檔的危險。 您可能會被使用開發人員提供的工具困住。
對於您的實際問題,您可以執行以下操作:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.