[英]How to read tabular format pdf document using python pandas?
我想閱讀以下格式的pdf文件-
data.pdf
Jan1 Jan2 Jan3 Jan4 Jan5 total
ABC 1.0 2.0 3.0 4.0 5.0 15.0
PQR 1 2 3 4 5 15
XYZ 2 2 2 2 2 10
我正在嘗試使用python pandas讀取此文件,但沒有獲得任何成功。 實際上我想將此文件轉換為csv格式,如下所示-
output.csv
names,Jan1,Jan2,Jan3,Jan4,Jan5,total
ABC,1.0,2.0,3.0,4.0,5.0,15.0
PQR,1,2,3,4,5,15
XYZ,2,2,2,2,2,10
我已經嘗試使用pdfminer,但沒有獲得任何成功。 它的html輸出只給我空白頁。
他們是使用python pandas讀取pdf文件的任何方式,還是可以將pdf轉換為任何格式然后使用python pandas讀取pdf?
如果已安裝表格,則:
from tabula import read_pdf
data = read_pdf('data.pdf')
然后您可以打印數據
print (df)
我希望這能幫到您 !
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.