繁体 English 中英

PyPDF2从扫描的pdf中提取垂直文本

[英]PyPDF2 to extract vertical text from scanned pdf

原文 2018-09-27 05:53:38 8 1 python/ python-3.x/ pypdf2/ pdfminer/ pdf-extraction

我正在尝试使用 PyPDF2 从扫描的 pdf 中提取文本。 一些 pdf 包含垂直对齐的文本。 但是页面的方向是纵向的。 有什么方法可以识别文本是否垂直对齐并使用 pdfminer 或 PyPDF2 读取 PDF 中的垂直线

1 个解决方案

目前没有办法用 PyPDF2 做到这一点（我是 PyPDF2 的维护者）。

另见： https ://github.com/py-pdf/PyPDF2/issues/1071

PyPDF2 和 PyPDF4 无法从 PDF 中提取文本

[英]PyPDF2 and PyPDF4 fails to extract text from the PDF

使用Pypdf2从网页转换的pdf中提取文本

[英]Extract text from pdf converted from webpage using Pypdf2

使用PyPDF2从目录中的PDF文件中提取文本

[英]Extract text from PDF files in a directory using PyPDF2

如何从 PDF 上的特定位置/跨度提取文本 (PyPDF2)

[英]How to extract text (PyPDF2) from specific location/span on PDF

PyPDF2 不会从 PDF 中提取所有文本

[英]PyPDF2 won't extract all text from PDF

从 PDF url 中提取文本与 io 和 PyPDF2 没有给出 Z78E6221F6393D1356CEZ8681

[英]Extract text from PDF url with io and PyPDF2 gives no output

使用 Python 和 PyPDF2 从 PDF 文件中提取文本

[英]Extract text from PDF File using Python with PyPDF2

使用 PyPDF2 从 pdf 中提取文本

[英]Issue extracting text from pdf with PyPDF2

如何使用 Pypdf2 从 Pdf 中提取文本，不包括图表和表格中的文本内容

[英]How to extract text from Pdf using Pypdf2 excluding the text content from Charts and Tables

如何使用PyPDF2从.pdf文件中提取所有文本并将其作为STRING返回？

[英]How to use PyPDF2 to extract all the text from a .pdf file and return it as a STRING?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 PyPDF2 和 PyPDF4 无法从 PDF 中提取文本使用Pypdf2从网页转换的pdf中提取文本使用PyPDF2从目录中的PDF文件中提取文本如何从 PDF 上的特定位置/跨度提取文本 (PyPDF2) PyPDF2 不会从 PDF 中提取所有文本从 PDF url 中提取文本与 io 和 PyPDF2 没有给出 Z78E6221F6393D1356CEZ8681 使用 Python 和 PyPDF2 从 PDF 文件中提取文本使用 PyPDF2 从 pdf 中提取文本如何使用 Pypdf2 从 Pdf 中提取文本，不包括图表和表格中的文本内容如何使用PyPDF2从.pdf文件中提取所有文本并将其作为STRING返回？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM