簡體   English   中英

用於解析.doc文件的Ruby庫?

[英]Ruby libraries for parsing .doc files?

我只是想知道是否有人知道有什么好的庫可以解析.doc文件(以及類似的格式,如.odt)以提取文本,同時還保留格式信息以便在網站上顯示。

對PDF進行類似處理的能力將是一個好處,但是我對此並不怎么看。

如果有幫助,這是針對Rails項目的。

提前致謝!

Apache的POI是訪問Word和Excel文檔的一種非常流行的方式。 有一個Ruby POI綁定可能值得研究,但是看起來您必須自己構建它。 而且該API看起來不像Ruby,因為它實際上是Java代碼的直接端口。 而且似乎只針對Ruby 1.8.2進行了測試。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM