[英]Ruby libraries for parsing .doc files?
我只是想知道是否有人知道有什么好的庫可以解析.doc文件(以及類似的格式,如.odt)以提取文本,同時還保留格式信息以便在網站上顯示。
對PDF進行類似處理的能力將是一個好處,但是我對此並不怎么看。
如果有幫助,這是針對Rails項目的。
提前致謝!
Apache的POI是訪問Word和Excel文檔的一種非常流行的方式。 有一個Ruby POI綁定可能值得研究,但是看起來您必須自己構建它。 而且該API看起來不像Ruby,因為它實際上是Java代碼的直接端口。 而且似乎只針對Ruby 1.8.2進行了測試。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.