簡體   English   中英

從PDF提取數據並導入到Excel .NET

[英]Extract Data from PDF and Import to Excel .NET

是否有示例代碼或實用程序可用於讀取PDF文檔並將數據轉換或導出為Excel文檔?

我在搜索時看到的大多數示例代碼都是將Excel轉換為PDF。

問題在於PDF可能不會保留任何電子表格類型的結構-它只是在頁面上繪制的文本。 因此,除非頁面非常簡單,否則您不太可能對結果感到滿意。

你可以拉出來的數據與pdfsharp和使用OPENXML SDK創建一個Excel文件。 這樣一來,您將獲得所需的一切。 這將需要一些工作,但是不需要excel或acrobat或任何花錢的東西。

優點:

  • 自由
  • 沒有Excel對象模型
  • 僅使用庫
  • 你得到你想要的

缺點:

  • 需要時間來編碼

我創建了一個解決方案,使用開源XPDF和VBA的組合以結構化格式將多個PDF文件中的數據導入Excel。 它的工作方式是指定開始和結束文本模式,然后提取中間的文本,並使用可選的替換文本來清理輸出。 該解決方案可以從http://www.business-spreadsheets.com/forum.asp?t=884免費下載

您唯一真正的選擇是尋找第三方解決方案。 我懷疑您會找到一個免費的SDK來執行此操作,原因很簡單,那就是它並不那么容易。 我將檢查Solid Documents以及可能的Investintech解決方案

較新版本的Acrobat還提供了一些更高級的PDF至Excel提取功能,因此Adobe的PDF Library SDK也可能值得一看。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM