我下载了pdfminer.six,并希望将命令行工具pdf2txt.py作为软件包的一部分。 但是,当我尝试使用dos2unix进行转换时(我有OS X,这使事情变得有些棘手),我收到以下消息:

    dos2unix: /usr/local/bin/pdf2txt.py: No such file or directory
    dos2unix: Skipping /usr/local/bin/pdf2txt.py, not a regular file.

还有其他人遇到这个问题吗?您如何解决呢?

  ask by Andrew R. Calderon translate from so

本文未有回复,本站智能推荐:

1回复

如何在python脚本和外部命令行中使用pdfminer.six的pdf2txt.py?

我知道如何在命令行中使用pdfminer.six的pdf2txt.py工具; 但是,我有很多PDF文件要转换为txt文件,我不能在命令行中逐个进行。 我还没有找到如何在实际的python脚本中使用此工具。 有任何想法吗?
1回复

无法在Windows 10上安装pdfminer.six

在我的cmd窗口中,键入 这给了我这些错误。 我在Windows 10上使用Python 3.6。该怎么办? 有什么方法可以不使用pip来安装此软件包? 我想使用此链接: https : //pypi.python.org/pypi/pdfminer.six/20170720
2回复

使用 pdfminer.six 从 URL 打开 PDF

背景:Python 3.7 & pdfminer.six 使用此处找到的信息: 使用 Python 从 PDF 导出数据,我有以下代码: 这有效(是的!),但我真正想做的是通过其 url 直接请求 pdf,而不是打开已预先保存到本地驱动器的 pdf。 我不知道我需要如何修改“打开”逻
1回复

遍历.PDF并使用PDFMiner将它们转换为.txt

我正在尝试合并两个我已经能够独立完成的事情。 不幸的是,PDFMiner文档根本没有用。 我有一个包含数百个PDF的文件夹,其中没有特定的顺序,名称为"[0-9].pdf" ,并且我不在乎对它们进行排序。 我只需要一种方法来浏览它们并将它们转换为文本。 使用本文: 在Python
2回复

PDF转文本Python 3.6 pdfminer没有名为'pdfminer'的模块

我尝试使用pdfminer.six使用python 3.6.3将目录中的多个pdf转换为多个.txt文件 我收到以下错误: ModuleNotFoundError:运行以下代码时, 没有名为“ pdfminer”的模块 。 或者,当我运行pdf2txt.py filename.pdf时,
1回复

使用pdf miner解析pdf时如何忽略字符集错误

大家好,我在使用 pdf miner 解析 pdf 文件时遇到编码错误。 from io import BytesIO from pdfminer import layout from pdfminer.high_level import extract_pages from pdfminer.l
5回复

在python中使用PDFMiner从PDF文件中提取文本?

我正在寻找有关如何使用 PDFMiner 和 Python 从 PDF 文件中提取文本的文档或示例。 看起来 PDFMiner 更新了他们的 API,我发现的所有相关示例都包含过时的代码(类和方法已更改)。 我发现可以更轻松地从 PDF 文件中提取文本的库使用旧的 PDFMiner 语法,因此我不
1回复

如何修复'无法从'pdfminer.pdfinterp'导入名称'process_pdf'错误

我正在尝试将pdf文件中的文本转换为文本或HTML格式,但是经常发生此错误“无法从'pdfminer.pdfinterp'导入名称'process_pdf''如何删除此文件? 我已经在Visual Basic Studio中尝试了此代码,但仍然无法正常工作,但是在这种情况下,由于空格而导致