是否有 Java 或 Nodejs 库可以移动 PDF 文件中的现有文本? 我想提取所有文本节点,然后根据某些条件将其中一些节点移动到新位置。 我尝试了 PdfClown、galkahana/HummusJS、Hopding/pdf-lib,但似乎他们没有我需要的东西。 谁能帮忙? 谢谢 ...
是否有 Java 或 Nodejs 库可以移动 PDF 文件中的现有文本? 我想提取所有文本节点,然后根据某些条件将其中一些节点移动到新位置。 我尝试了 PdfClown、galkahana/HummusJS、Hopding/pdf-lib,但似乎他们没有我需要的东西。 谁能帮忙? 谢谢 ...
我是 PDFClown 的新手,需要帮助解析我的 pdf 内容。 我的 PDF 有大量 MarkedContents,在转换为 Stream 时显示。 但是我无法将它们解析为对象以提取其中包含的路径信息,这是我的目标。 这是我的代码 - 下面是 DOM Inspector 截图和流数据 ...
我想在PDF中标识ColorSpace对象,并获取它们在页面中的位置(坐标,颜色空间的宽度和高度)。 我尝试遍历Contents.ContentContext.Resources.ColorSpaces的BaseDataObject ,我可以在文件中标识Pantone色彩空间 (如屏幕截图所示 ...
我已经将PDFClown nuget包添加到.net核心项目中,并在运行时遇到以下错误: 无法加载文件或程序集“ PDFClown,Version = 0.1.2.0,Culture = neutral,PublicKeyToken = null”或其依赖项之一。 需要一个全名程序集 ...
我正在使用PDF Clown(在C#中)生成一个PDF文件,该文件在单独的图层上包含图形(线,多边形和圆形)。 现在我遇到了问题,已经在互联网上搜索了几天,但找不到解决方案。 我有以下问题:如何确保可以使用Blue Beam或Adobe Acrobat等其他应用程序编辑/修改PDFClo ...
我正在使用来自数据库的数据使用PDFClown生成大型Report pdf文件。 该过程需要很长时间,并且最终在页数接近150标记时占用了超过1.5GB的内存,并且最终出现内存不足的错误: PDFClown.dll中发生类型为'System.OutOfMemoryExceptio ...
我正在尝试从pdf中提取色彩空间数据。 我有一个具有Pantone和CMYK色彩空间的文件。 当我使用任何pdf库(我使用pdfclown,pdfbox和icePdf)从PDF提取色彩空间时,输出数据仅包含Pantone色彩空间数据,甚至不包含有关CMYK色彩空间的单个信息。 我在Core ...
我需要将注释从一个PDF文件复制到另一个。 我使用了出色的PDFClown库,但无法处理颜色,旋转等问题。这可能吗? 我可以看到基础对象信息,但也不确定如何直接操作它。 我可以通过复制外观来复制外观,但是不能“编辑”它。 提前致谢。 亚历克斯 PS:如果斯蒂芬诺(Step ...
我在pdfclown中得到了要求,例如是否有很少的子字符串/与另一个关键词匹配的关键词,而突出显示这些关键词必须被覆盖并且应该允许突出显示完整关键词。例如在下面的地图中ETS关键词是just.ETS的子字符串和Test.ETS关键字。 预期结果应类似于我们需要突出显示完整关键字,例如just. ...
当我加载一份中文文档而不是所有中文文档时,我遇到了以下异常。我的需求文档不是编码格式,它看起来像普通/普通的中文文档。根据保密问题,我没有提供我的需求文档。请提供您的支持所有中文pdf文档的输入。 ...
我面临一些搜索关键字在中文文档中没有突出显示的问题。由于机密问题,我没有提供实际的 pdf。 搜索关键字是1)或2)收入亿来源请找到我测试过的pdf文档路径,pdfpath 链接。 和 ActualResult 链接。我已经在以下链接中发布了与此问题相关的内容,但在少数中文文档中,某些关键字没有正确 ...
我正在使用 pdfclown 和以下代码需要大约 100 秒来突出显示同一文件中的搜索关键字。请提供您的输入以提高以下代码中的性能。请在以下 url 中找到 jar 路径以运行此代码。 https://drive.google.com/drive/folders/1nW8bk6bcAG6g7LZY ...
我正在使用 pdf 小丑,我得到了像将非英语搜索关键字的颜色突出显示为橙色的要求。目前,我可以按照屏幕截图搜索关键字并用黄色突出显示非英语关键字: 请提供您的输入以将非英语搜索关键字的颜色突出显示为橙色。提前致谢。 ...
我有一个 PDF 文件,我正在使用 PDF Clown 阅读该文件,然后向其中添加一些注释。 之后,我尝试使用 org.pdfclown.files.File 的 Save 方法将文件序列化到磁盘。 在这样做时,我收到以下错误 运行示例时发生异常:org.pdfclown.util.parser ...
我正在将pdf-clown与pdfclown-0.2.0-HEAD.jar一起使用。我编写了以下代码以突出显示中文pdf文件中的关键字,并且相同的代码对英语pdf文件也能正常工作。 请提供您的输入内容,以突出显示非英语pdf文件的特定搜索关键字。 我在中文的下面文本中搜索关键 ...
使用pdfclown, 我想知道最佳做法是在现有PDF文档中查找页面,并替换为另一个PDF文档中的页面。 我有两个页面的书签和pagelabel。 ...
我正在使用PDFClown分析和使用PDFDocuments。 我的目的是突出显示表格中的所有数字。 对于所有在一起的数字(例如:表的一列中的所有数字),我将创建一个带有四边形列表的TextMarkup。 首先,看起来一切都工作正常:左侧的所有突出显示都属于一个TextMarkup,右侧的 ...
我正在使用PDFClown突出显示PDF文档中的多个搜索词。 在许多包含彩色图像,复杂图的pdf文档中,彩色文本PDFClown在那里引发异常,并且不能突出显示匹配的单词。 提到的代码对于普通或简单的Pdf都可以正常工作。 这是我用来测试https://drive.google.com ...
我正在使用PDFClown分析PDF文档。 在许多文档中,PDFClown中的某些字符似乎具有不同的高度,即使它们显然具有相同的高度。 有解决方法吗? 这是代码: 这是一个PDFDocument示例: 例 在本文档中,我标记了两个文本块,两个文本块均包含“百万”一词 ...
目前我有这个测试代码 如何打开常规Windows资源管理器另存为提示,而不是保存到硬代码路径“ test.pdf”? (在file.save() ) 谢谢 ...