[英]can't read .docx file after uploading (nodejs)
因此,我正在嘗試使用express-fileupload
軟件包將.docx文件上傳並讀取到Express服務器。 上傳部分工作正常,但由於某種原因我無法讀取該文件,因為它會打印不可讀的亂碼文本。 以下是代碼:
app.post('/upload', (req, res, next) => {
let file = req.files.file;
file.mv(`${__dirname}/public/${req.body.filename}`, function(err) {
if (err) {
return res.status(500).send(err);
}
fs.readFile(`${__dirname}/public/${req.body.filename}`, 'utf8', function (err,data) {
if (err) {
return console.log(err);
}
console.log(data) // prints broken text/gibberish;
});
res.json({data to be returned});
});
});
我想要的是能夠讀取.docx文件並對其中的文本進行操作。
docx文件不包含人類可讀的文本。 它們實際上是包含許多不同XML文件的ZIP文件-但是,即使XML文件的文本內容也很難使用。
如果要讀取甚至修改docx文件中的文本,則需要找到一個可以讀取/寫入格式的庫。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.