[英]Parse Microsoft Office files in Node.JS
我正在開發一個 Web 應用程序,用戶可以在其中上傳 Microsoft Office 文檔文件。 現在,我們的服務器運行 Node.JS 和 Express.js,我們托管在 Heroku 上。 因此,我認為我無法安裝諸如 abiword 或 catdoc 之類的程序。 我可以處理文件上傳,但無法解析文檔的內容。
如何讀取 doc 文件的內容? 然后將信息放入數據庫。 保留基本格式(粗體、斜體、下划線)會很好,但不是必需的。
Office包: npm install office
似乎至少提供了部分答案。 我用它來讀取 Excel 文件,到目前為止還沒有嘗試過任何 Word 文檔。
似乎還沒有。 請參閱下文了解可能有幫助的內容。
您可以使用 mammoth 解析 .docx 文件https://www.npmjs.com/package/mammoth和 xlsx 解析 .xlsx 文件https://github.com/SheetJS/js-xlsx
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.