簡體   English   中英

使用nodejs將具有表格的pdf轉換為xlsx / xls

[英]convert a pdf having a table to xlsx/xls using nodejs

我有一個包含表和數據的pdf。

我想將其轉換為xlsx / xls ,我嘗試了很多方法,例如將pdf轉換為json ,將json轉換為xlsx / xls,但是我沒有得到想要的結果,我想要鍵和值對中json數據

let fs = require('fs'),
PDFParser = require("pdf2json");
let pdfParser = new PDFParser();

pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError) );
pdfParser.on("pdfParser_dataReady", pdfData => {
    fs.writeFile("./pdf2.json", JSON.stringify(pdfData),(error) => { 
                if(error)
                {
                    console.log(error);
                }
         });
});

pdfParser.loadPDF("./Sample Data.pdf");

我的pdf看起來像這樣

您可以使用pdf2table或pdfreader從pdf文件中讀取數據並將該數據成形為所需的json格式。

添加示例代碼以供參考

// pdf2table

var pdf2table = require('pdf2table');
var fs = require('fs');

fs.readFile('./tests.pdf', function (err, buffer) {
    if (err) return console.log(err);

    pdf2table.parse(buffer, function (err, rows, rowsdebug) {
        if(err) return console.log(err);
        console.log(rows);
    });
});

// pdf閱讀器

var pdfreader = require('pdfreader');
var table = new pdfreader.TableParser();

new pdfreader.PdfReader().parseFileItems('tests.pdf', function(err, item){
  if( err ) {
      console.log( err )
  } else {
      console.log( item.text)
     //create json as you want
  }
});

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM