簡體   English   中英

如何使用python熊貓閱讀表格格式的pdf文檔?

[英]How to read tabular format pdf document using python pandas?

我想閱讀以下格式的pdf文件-

data.pdf

       Jan1 Jan2 Jan3 Jan4 Jan5 total
ABC    1.0  2.0  3.0  4.0  5.0  15.0
PQR    1    2    3    4    5    15
XYZ    2    2    2    2    2    10

我正在嘗試使用python pandas讀取此文件,但沒有獲得任何成功。 實際上我想將此文件轉換為csv格式,如下所示-

output.csv

names,Jan1,Jan2,Jan3,Jan4,Jan5,total
ABC,1.0,2.0,3.0,4.0,5.0,15.0
PQR,1,2,3,4,5,15
XYZ,2,2,2,2,2,10

我已經嘗試使用pdfminer,但沒有獲得任何成功。 它的html輸出只給我空白頁。

他們是使用python pandas讀取pdf文件的任何方式,還是可以將pdf轉換為任何格式然后使用python pandas讀取pdf?

如果已安裝表格,則:

from tabula import read_pdf
data = read_pdf('data.pdf')

然后您可以打印數據

print (df)

我希望這能幫到您 !

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM