是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#1 票数:153 已采纳

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#2 票数:138

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#3 票数:72

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#4 票数:51

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#5 票数:45

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#6 票数:21

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#7 票数:17

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#8 票数:9

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#9 票数:6

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#10 票数:1

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#11 票数:1

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#12 票数:1

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

===============>>#13 票数:0

是否有将python文件转换为文本的python模块? 我尝试了在Activestate中找到的一段使用pypdf的代码,但是生成的文本之间没有空格,也没有用。

  ask by cnu translate from so

未解决问题?本站智能推荐:

5回复

使用C#或经典ASP(VBScript)从PDF中提取文本的好方法是什么? [关闭]

是否有一个很好的库来从PDF中提取文本? 如果必须,我愿意为此付出代价。 适用于C#或经典ASP(VBScript)的东西是理想的,我还需要能够将页面与PDF分开。 这个问题有一些有趣的东西,特别是pdftotext,但如果可以的话,我想避免调用外部命令行应用程序。
4回复

议会辩论PDF的光学字符识别

对于合同工作,我需要数字化来自德国联邦议会的许多旧的,只有扫描图像的全会辩论协议PDF。 问题是这些文件大多数都具有两列格式: 样本协议http://sert.homedns.org/img/btp12001.png 我很想阅读您对以下问题的回答: 在将两列送入OCR
3回复

从PDF python中提取/识别表格[关闭]

是否有支持表格识别和提取的开源库? 我的意思是: 识别存在的表结构 从表中对表进行分类 以有用的输出格式从表中提取数据,例如JSON / CSV等。 我在这个主题上看了类似的问题,发现了以下内容: PDFMiner解决问题3,但似乎用户需要指定P
4回复

使用python处理pdf表

我正在处理pdf文件。 该pdf中有许多表格。 根据pdf中提供的表名,我想使用python从该表中获取数据。 我从事过html,xlm解析,但从未使用过pdf。 谁能告诉我如何使用python从pdf获取表格?
2回复

如何在pdf文件中逐行阅读并创建CSV文件

这是我的pdf 我找到了这个,并用它来刮掉我的pdf。 它非常混乱。 或是因为PDF格式无法读取? 我以为有一种方法可以抓取每一行并通过迭代等方式创建带有列的CSV文件。 就像用列填充CSV 有没有解决的办法?
4回复

如何在Python中解锁“安全”(读保护)PDF?

在Python中,我使用pdfminer从pdf中读取文本,并在此消息下面显示代码。 我现在收到一条错误消息: 当我用Acrobat Pro打开这个pdf时,它证明它是安全的(或“读保护”)。 但是,从这个链接 ,我读到有很多服务可以轻松禁用这种读保护(例如pdfunlock.com
1回复

我想用python刮一个Hindi(Indian Langage)pdf文件

我编写了python代码,用于从PDF文件中删除所有数据。 这里的问题是,一旦被刮掉,这些词就会失去他们的语法。 如何解决这些问题? 我附上了代码。 这是PDF的截图。
3回复

提取pdf文本并将其列表在行标题下的最佳语言[关闭]

我基本上想拥有的是行标题下的PDF数据,或者为了简化我想说的,我想根据PDF文件创建一个数据库。每个PDF包含25-40页,具体取决于投票者的数量。 我正在谈论的pdf文件页面 我想将框(或您所说的话)中的数据提取到Access / Excel / SQL中,以便从每个框中提取数据
2回复

PDF数据解析器可以读取PowerPoint PDF吗?

我目前正在开发一个专有的PDF解析器,它可以读取具有各种数据类型的多种类型的文档。 在开始之前,我在考虑是否可以阅读PowerPoint幻灯片。 我的雇主使用的演示准则要求图像和背景设计-是否可以构建一个解析器,以从这些PowerPoint PDF中读取数据,而不会妨碍幻灯片的装饰?
1回复

pdf2txt.py没有执行命令

每当我在命令行上使用pdf2txt.py时,源文件就会打开,命令也不会执行。 我刚刚安装了这些软件包,但却无法运行它们。 例如,我将输入命令: 键入命令后,文件pdf2txt.py将打开,命令将不会执行。 有没有人遇到过这个? 我究竟做错了什么? 我正在使用Windows命