簡體   English   中英

無法在 Python 3.6 上安裝 pdftotext,缺少 poppler

[英]Unable to install pdftotext on Python 3.6, missing poppler

如何正確安裝 pdftotext?

在 Python 3.6 中安裝 pdftotext 時,我收到以下錯誤消息。 我還嘗試通過下載 zip 文件手動安裝軟件包,但仍然遇到相同的錯誤。

  pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory
  error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\cl.exe' failed with exit status 2     

我在 pdftotext 包的 Readme.md 文件中找到了一些幫助:

1)安裝操作系統依賴:

在 Debian、Ubuntu 和朋友上:

sudo apt-get update
sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev

關於 Fedora、Red Hat 和朋友:

sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config

2)進行正常安裝:

pip install pdftotext

它對我有用。

幾天來,我一直在試圖弄清楚如何在 Win10 上安裝 pdftotext。 互聯網搜索沒有給我任何東西。 所以對於那些需要了解的人來說,這里是使用 Anaconda 在 Win10 上安裝 pdftotext。 YMMV。

安裝蟒蛇 Python。 關於安裝 Anaconda 的文章很多,這里就不一一探討了。

嘗試運行 pip install pdftotext,您將收到需要 Microsoft Visual C++ 的錯誤。

在瀏覽器中導航到http://visualstudio.microsoft.com/downloads 在 Visual Studio 2019 的工具選項卡下,下載 Visual Studio 2019 的構建工具。然后,您將通過選中 C++ 構建工具選項框並單擊安裝來安裝這些工具。

您現在應該讓 pip install 越過 VC++ 錯誤。 不幸的是,您現在會收到錯誤消息“無法打開包含文件:'poppler/cpp/poppler-document.h'。 這是因為您缺少 poppler 庫。

回到互聯網! 您將需要用於 windows 的 poppler。 在撰寫本文時,您最好的選擇是http://blog.alivate.com.au/poppler-windows 獲取最新的二進制文件,然后解壓縮。 如果您查看錯誤,則 pip 正在 {Anaconda3 目錄}\include\poppler\cpp\poppler-document.h 中查找頭文件。 因此,請查看您剛剛解壓縮的存檔。 在包含文件夾中,您將看到一個 poppler 目錄。 如果您進入其中的 cpp 目錄,您會找到 poppler-document.h 文件。

我將整個 poppler 目錄復制到 Anaconda3\include 文件夾中,所以這樣做。

如果您嘗試再次運行 pip install,您仍然會收到大量錯誤! 但這些不是您之前看到的任何錯誤,而是此錯誤正在尋找缺少的鏈接庫 poppler-cpp.lib。 通過在另一台機器上安裝的 Conda 進行搜索,在 poppler 包中找到了這個文件。 所以

conda install -c conda-forge poppler

這將安裝我們的 poppler-cpp.lib 文件。 然后我們可以從 {Anaconda3 目錄}\Library\lib\poppler-cpp.lib 的主目錄復制該文件,並將其粘貼到 pdftotext 期望它位於 {Anaconda3 目錄}\libs 的位置。

如果我們再次執行 pip install pdftotext,就可以了! 我相信有人會找到一種方法來改進這一點,但現在我們在 Win10 上有一個工作的 pdftotext Python 庫。

可以在我的博客https://coder.haus/2019/09/27/installing-pdftotext-through-pip-on-windows-10/上找到這些說明和屏幕截圖

下面的命令為我解決了這個問題。

sudo apt-get install libpoppler-cpp-dev

https://blog.droidzone.in/2018/05/01/install-pdftotext-python-extension-error/

對於 Mac 操作系統: brew install poppler

對於 Ubuntu 用戶

sudo apt-get install libpoppler58=0.41.0-0ubuntu1 libpoppler-dev libpoppler-cpp-dev

為我工作

windows的簡單解決方案:

  1. http://blog.alivate.com.au/wp-content/uploads/2018/10/poppler-0.68.0_x86.7z下載 poppler zip 文件
  2. https://visualstudio.microsoft.com/thank-you-downloading-visual-studio/?sku=BuildTools&rel=15下載並安裝 Visual Studio 工具
  3. 將文件夾\poppler-0.68.0\bin設置為環境變量中的路徑。

而已。 重新啟動您的環境,例如可能是 jupyter notebook、vscode 等。享受

要在 Windows 10 上安裝 pdftotext,我嘗試遵循 Jason Woods 的回答。

我想補充一下這個答案,必須在 Visual Studio 中安裝“C++ 桌面應用程序開發”包。

確保也安裝“C++ Build Tools”,如 Jason Woods 的回答中所述。

按照他的其余答案。 快速總結:

  • 安裝蟒蛇 Python
  • 在 Anaconda Prompt 中,輸入: conda install -c conda-forge poppler
  • 現在安裝 pdftotext 包: pip install pdftotext

它對我有用。 謝謝你。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM