繁体   English   中英

无法在 Python 3.6 上安装 pdftotext,缺少 poppler

[英]Unable to install pdftotext on Python 3.6, missing poppler

如何正确安装 pdftotext?

在 Python 3.6 中安装 pdftotext 时,我收到以下错误消息。 我还尝试通过下载 zip 文件手动安装软件包,但仍然遇到相同的错误。

  pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory
  error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\cl.exe' failed with exit status 2     

我在 pdftotext 包的 Readme.md 文件中找到了一些帮助:

1)安装操作系统依赖:

在 Debian、Ubuntu 和朋友上:

sudo apt-get update
sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev

关于 Fedora、Red Hat 和朋友:

sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config

2)进行正常安装:

pip install pdftotext

它对我有用。

几天来,我一直在试图弄清楚如何在 Win10 上安装 pdftotext。 互联网搜索没有给我任何东西。 所以对于那些需要了解的人来说,这里是使用 Anaconda 在 Win10 上安装 pdftotext。 YMMV。

安装蟒蛇 Python。 关于安装 Anaconda 的文章很多,这里就不一一探讨了。

尝试运行 pip install pdftotext,您将收到需要 Microsoft Visual C++ 的错误。

在浏览器中导航到http://visualstudio.microsoft.com/downloads 在 Visual Studio 2019 的工具选项卡下,下载 Visual Studio 2019 的构建工具。然后,您将通过选中 C++ 构建工具选项框并单击安装来安装这些工具。

您现在应该让 pip install 越过 VC++ 错误。 不幸的是,您现在会收到错误消息“无法打开包含文件:'poppler/cpp/poppler-document.h'。 这是因为您缺少 poppler 库。

回到互联网! 您将需要用于 windows 的 poppler。 在撰写本文时,您最好的选择是http://blog.alivate.com.au/poppler-windows 获取最新的二进制文件,然后解压缩。 如果您查看错误,则 pip 正在 {Anaconda3 目录}\include\poppler\cpp\poppler-document.h 中查找头文件。 因此,请查看您刚刚解压缩的存档。 在包含文件夹中,您将看到一个 poppler 目录。 如果您进入其中的 cpp 目录,您会找到 poppler-document.h 文件。

我将整个 poppler 目录复制到 Anaconda3\include 文件夹中,所以这样做。

如果您尝试再次运行 pip install,您仍然会收到大量错误! 但这些不是您之前看到的任何错误,而是此错误正在寻找缺少的链接库 poppler-cpp.lib。 通过在另一台机器上安装的 Conda 进行搜索,在 poppler 包中找到了这个文件。 所以

conda install -c conda-forge poppler

这将安装我们的 poppler-cpp.lib 文件。 然后我们可以从 {Anaconda3 目录}\Library\lib\poppler-cpp.lib 的主目录复制该文件,并将其粘贴到 pdftotext 期望它位于 {Anaconda3 目录}\libs 的位置。

如果我们再次执行 pip install pdftotext,就可以了! 我相信有人会找到一种方法来改进这一点,但现在我们在 Win10 上有一个工作的 pdftotext Python 库。

可以在我的博客https://coder.haus/2019/09/27/installing-pdftotext-through-pip-on-windows-10/上找到这些说明和屏幕截图

下面的命令为我解决了这个问题。

sudo apt-get install libpoppler-cpp-dev

https://blog.droidzone.in/2018/05/01/install-pdftotext-python-extension-error/

对于 Mac 操作系统: brew install poppler

对于 Ubuntu 用户

sudo apt-get install libpoppler58=0.41.0-0ubuntu1 libpoppler-dev libpoppler-cpp-dev

为我工作

windows的简单解决方案:

  1. http://blog.alivate.com.au/wp-content/uploads/2018/10/poppler-0.68.0_x86.7z下载 poppler zip 文件
  2. https://visualstudio.microsoft.com/thank-you-downloading-visual-studio/?sku=BuildTools&rel=15下载并安装 Visual Studio 工具
  3. 将文件夹\poppler-0.68.0\bin设置为环境变量中的路径。

而已。 重新启动您的环境,例如可能是 jupyter notebook、vscode 等。享受

要在 Windows 10 上安装 pdftotext,我尝试遵循 Jason Woods 的回答。

我想补充一下这个答案,必须在 Visual Studio 中安装“C++ 桌面应用程序开发”包。

确保也安装“C++ Build Tools”,如 Jason Woods 的回答中所述。

按照他的其余答案。 快速总结:

  • 安装蟒蛇 Python
  • 在 Anaconda Prompt 中,输入: conda install -c conda-forge poppler
  • 现在安装 pdftotext 包: pip install pdftotext

它对我有用。 谢谢你。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM