簡體   English   中英

在 Node.JS 中解析 Microsoft Office 文件

[英]Parse Microsoft Office files in Node.JS

我正在開發一個 Web 應用程序,用戶可以在其中上傳 Microsoft Office 文檔文件。 現在,我們的服務器運行 Node.JS 和 Express.js,我們托管在 Heroku 上。 因此,我認為我無法安裝諸如 abiword 或 catdoc 之類的程序。 我可以處理文件上傳,但無法解析文檔的內容。

如何讀取 doc 文件的內容? 然后將信息放入數據庫。 保留基本格式(粗體、斜體、下划線)會很好,但不是必需的。

雖然您似乎無法使用 NPM 獲得任何可以直接執行 Word 的東西,但您或許可以使用 REST API 通過另一個雲服務來請求它。 例如Saaspose (它們是著名的 Aspose 工具)具有WordExcelPDF等的公共 API。 他們在他們的頁面上列出了 node.js、javascript 和 Heroku 支持。

編輯:

我看到 Saaspose 現在被稱為Aspose for Cloud

另一個聲稱類似的 API 是Doxument

Office包: npm install office似乎至少提供了部分答案。 我用它來讀取 Excel 文件,到目前為止還沒有嘗試過任何 Word 文檔。

似乎還沒有。 請參閱下文了解可能有幫助的內容。

我可以使用 Node.js 閱讀 PDF 或 Word 文檔嗎?

您可以使用 mammoth 解析 .docx 文件https://www.npmjs.com/package/mammoth和 xlsx 解析 .xlsx 文件https://github.com/SheetJS/js-xlsx

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM