簡體   English   中英

是否有用於在linux上搜索msword doc文件的模塊?

[英]Is there a module for searching in msword doc-files on linux?

通常我正在使用grep -r --color word /path/dir搜索,但這對二進制文件不起作用。 所以我想編寫一個類似的Perl腳本。 因此,我正在搜索一個可以在Linux機器上讀取doc文件的模塊(可能類似於Spreadsheet :: ParseExcel for ms-word-documents)。

有很多單詞到文本轉換器(如antidoc,wv,catdoc,unoconv ......)。 你可以通過他們的輸出grep。 這也是msysgit對doc文件編目的作用。

不試圖聽起來很諷刺,這是使用閉源專有文檔的危險。 您可能會被使用開發人員提供的工具困住。

對於您的實際問題,您可以執行以下操作:

  1. 打開文件並保存為RTF(富文本)或甚至是純文本,這應該更易於搜索。
  2. 使用LibreOffice打開(在Oracle接管之前稱為OpenOffice強制分叉),這可能允許更多可自定義的搜索(如果有人提供了這樣的插件)或者可以用於通過方法1進行轉換

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM