[英]Tabula-Py not working - Called Process Error - non-zero exit status 1
我正在嘗試使用 Tabula-py 從 PDF 中抓取一些數據,但是我無法讓它正常工作。 我在我的 Jupyter 筆記本(在 Mac 上)運行這個:
from tabula import read_pdf
df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")
我收到此錯誤:
Error:
---------------------------------------------------------------------------
CalledProcessError Traceback (most recent call last)
<ipython-input-5-57f646d3a440> in <module>()
----> 1 df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")
2 #/Users/jamesozden/Desktop/data_scrape_table.pdf
/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/wrapper.pyc in read_pdf(input_path, output_format, encoding, java_options, pandas_options, multiple_tables, **kwargs)
83
84 try:
---> 85 output = subprocess.check_output(args)
86
87 except FileNotFoundError as e:
/Users/jamesozden/anaconda/lib/python2.7/subprocess.pyc in check_output(*popenargs, **kwargs)
217 if cmd is None:
218 cmd = popenargs[0]
--> 219 raise CalledProcessError(retcode, cmd, output=output)
220 return output
221
CalledProcessError: Command '['java', '-jar', '/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/tabula-1.0.1-jar-with-dependencies.jar', '--pages', '1', '--guess', '/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf']' returned non-zero exit status 1
所以我閱讀了一些關於安裝 java 的先前問題,我這樣做了。 我還確保將路徑添加到我的 bash 配置文件中(我對此比較陌生,所以我不確定我是否正確完成了它)。 這是我添加到我的 bash.profile 的行,以防有人想確保它沒問題,這是我使用which java
:
export PATH="$HOME/usr/bin/java/bin:$PATH"
任何幫助將不勝感激,謝謝!
我設法自己排序! 事實證明,即使我已經下載了 Java 的更新版本,但使用的是 1.6 版(此版本使用 java -version 看到)。 我使用自制軟件升級到 java 8,現在它工作正常。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.