cost 80 ms
将 HTML 转换为 PDF,并为 Java 中的不同页面设置动态边距 - Convert HTML to PDF With a Dynamic Margin for Different Pages in Java

我们正在努力从 HTML 创建 PDf,它将打印在法律页面上 - 它仅包含顶部前 3 页的金融邮票。 因此,我们只需要为金融印章的空间设置前 3 页的大页边距和页面 rest 的默认页边距。 我们正在使用 CYaHPConverter 进行 HTML -> PDF 转换,它不支持运行时 pdf ...

fo:region-body "xsl-region-body" 的边框和填充应该是 '0' 如果启用宽松验证,则允许使用非标准值 - Border and padding for fo:region-body "xsl-region-body" should be '0' non-standard values are allowed if relaxed validation is enabled

您好,我正在使用 fop 从 XML 文件生成一个 PDF Java 11 版本 Spring boot starter 2.5.2 org.apache.xmlgraphics (fop) 版本 2.7 我收到这个错误 org.apache.fop.fo.ValidationException ...

如何从用 Python 保存为 pdf 的复印件中提取文本 - How to extract text from a photocopy saved as a pdf in Python

我发现以下代码允许从 pdf 文件中提取文本。 但是,这仅适用于 pdf,您可以在其中直接通过突出显示复制文本。 我很好奇是否有某种方法可以从无法在 Python 中选择文本的文档中提取文本,例如保存为 pdf 的复印件或扫描文档? 这是我用来从非影印 pdf 文件中获取文本的代码 奇迹般有效。 但 ...

有没有办法从 Python/pandas 中的字符串中只删除坏字符? - Is there way to remove only BAD characters from a string in Python/pandas?

我正在尝试使用 Camelot 库读取 PDF 并将其存储到数据框中。 生成的数据框在字符串字段中有乱码/坏字符。 例如: 123Rise – Tower & Troe 's Mech – 我只想删除乱码字符并保留包括符号在内的所有其他内容。 我尝试了诸如 [^\w.,&,'- ...

超出上下文截止日期-goteberg api (/forms/libreoffice/convert) - Context deadline exceeded- goteberg api (/forms/libreoffice/convert)

我正在尝试使用 gotenberg api 将 ms-office 文件转换为 pdf。 对于某些文件,我收到 unoconv PDF 上下文截止日期超过 503 状态。 我已将读取、写入和处理超时增加到 60 秒。 我该如何解决这个问题? 转换文件所需的最长时间是多少? 一个 gotenberg ...

ExportAsFixedFormat for VBA 保存文件 - ExportAsFixedFormat for VBA saving Files

我在保存一堆 pdf(从 WordDocuments 导出)的过程中遇到问题。 我的程序的运行时行为有点奇怪,这就是我问的原因。 所以我想将文件保存在全局驱动器上。 在我的程序中,我创建了一个文件夹(在那个驱动器中)我放置了所有的 pdf。 不知何故,如果我第一次执行此操作,它真的很慢。 但是,如果 ...

关于 pdf 到 Node JS 图像转换的问题 - Questions regarding pdf to image conversion with Node JS

计划是创建一个 pdf 文件(仅包含一个页面),然后用户选择是下载为 PDF 还是图像。 我已经编写了用于生成 PDF 的代码,它现在工作正常。 现在的问题是如何将其转换为图像。 是否可以在不安装 Ghostscript 等东西的情况下转换文件? 我是一个完整的菜鸟,非常感谢您的建议。 (关于使用 ...

Converting XAML to PDF and Paginating it for a Xamarin.Forms UWP Project - Converting XAML to PDF and Paginating it for a Xamarin.Forms UWP Project

直到最近,我一直被困在如何在一个项目中实现将报告从StackLayout “导出”到 PDF 的目标上,我以某种方式退出了 Dev Limbo。 --背景故事-- 以前我曾尝试继续使用已放置的(在项目中) PDFSharp package 将 XAML 中提供的数据转换为客户的 PDF。 长话短 ...

如何从带有 python 的文件夹中的 pdf 中提取文本并将它们保存在 dataframe 中? - How to extract text from pdfs in folders with python and save them in dataframe?

我有很多文件夹,每个文件夹都有几个 pdf 文件(其他文件类型,如 .xlsx 或 .doc 也有)。 我的目标是提取每个文件夹的 pdf 文本并创建一个数据框,其中每条记录都是“文件夹名称”,每列以字符串形式表示该文件夹中每个 pdf 文件的文本内容。 我设法使用tika package(代码如 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM