繁体 English 中英

区分 PDF 文件中的空白页 VS X 跨页使用 iText7 C#

[英]Differentiate between blank page VS X-Cross page in PDF file Using iText7 C#

原文 2021-03-22 16:20:01 8 1 c#/ itext7

我正在使用 IText7 将 PDF 文档拆分为多个 PDF 文档。 例如，我有一个包含多个页面组合的 PDF 文档。

第 1 页 - 带有 X 十字符号的页面
第 2 页 - 空白页
第 3 页 - 带文字的页面
第 4 页 - 带有 X-Cross 符号的页面
第 5 页 - 空白页
第 6 页 - 带文字的页面
第 7 页 - 带有 X-Cross 符号的页面

当我尝试阅读页面详细信息的文本时，第 1 页和第 2 页都将文本返回为空。

我的问题是：如何确定空白页和带有 X-Cross 符号的页面？ 任何帮助将不胜感激。

1 个解决方案

在评论中，您解释说X-Cross 符号实际上是bitmap 图像。 因此，要检查页面上是否有这样的符号，您必须应用bitmap 图像提取，而不是文本提取。 关于堆栈溢出时的 bitmap 图像提取有许多问题和答案，例如 iText 7 开发团队的 Alexey Subach 的回答。

如果幸运的话，空白页确实是空白的（并且不包含例如纯白色或纯透明 bitmap 图像）。 在这种情况下，您只需要检查页面是否有（a）任何文本（您已经检查过）以及是否有（b）任何 bitmap：

如果两者都没有，则为Blank Page 。
如果它只有一个图像，它是一个带有 X-Cross 符号的页面。
如果它有文本，则它是一个带有 Text 的页面。

如果事情更复杂，您将不得不更仔细地查看，例如分析在页面上找到的位图。 如果所有这些 X-Cross 符号位图都相同，您可以将找到的 bitmap 图像与您首先提取的示例进行比较。

通过C＃使用itext7通过acrofield获取pdf页码

[英]Get pdf page number by acrofield using itext7 with C#

使用 iText7 和 ASP.NET C# 在 PDF 文件的页脚添加页码

[英]Add a page number in the footer of a PDF file using iText7 and ASP.NET C#

使用 iText7 C# 将 Javascript 添加到 PDF 文件

[英]Add Javascript to PDF file using iText7 C#

使用iText7 C＃签署pdf

[英]Sign pdf using iText7 C#

如何修改现有 PDF 中的外部链接，使其指向使用 IText7 和 C# 的文档中的内部页面？

[英]How do I modify external link in an existing PDF such that it points to an internal page within document using IText7 and C#?

如何使用 C# iText7 将 PDF Portfolio 中的所有 pdf 文件合并为普通 pdf 文件？

[英]How to merge all pdf files from a PDF Portfolio to a normal pdf file using C# iText7?

使用 iText7 C# 解析/读取 PDF 文档

[英]Parsing/Reading a PDF Document using iText7 C#

从包含 html 代码的 MySql 表中创建 pdf 文件，使用 iText7 和 ASP NET ZD7EFA19FBE242236

[英]Create pdf file from MySql table containing html code using iText7 and ASP NET C#

C# [itext7] GetTextFromPage 附加每个页面

[英]C# [itext7] GetTextFromPage appends each page

iText7 PDF 具有自定义大小的多个页面

[英]iText7 PDF with multiple Page in Custom Size

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 通过C＃使用itext7通过acrofield获取pdf页码使用 iText7 和 ASP.NET C# 在 PDF 文件的页脚添加页码使用 iText7 C# 将 Javascript 添加到 PDF 文件使用iText7 C＃签署pdf 如何修改现有 PDF 中的外部链接，使其指向使用 IText7 和 C# 的文档中的内部页面？如何使用 C# iText7 将 PDF Portfolio 中的所有 pdf 文件合并为普通 pdf 文件？使用 iText7 C# 解析/读取 PDF 文档从包含 html 代码的 MySql 表中创建 pdf 文件，使用 iText7 和 ASP NET ZD7EFA19FBE242236 C# [itext7] GetTextFromPage 附加每个页面 iText7 PDF 具有自定义大小的多个页面

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM