标签[pdf-conversion] - 堆栈内存溢出

将 HTML 转换为 PDF，并为 Java 中的不同页面设置动态边距 - Convert HTML to PDF With a Dynamic Margin for Different Pages in Java

我们正在努力从 HTML 创建 PDf，它将打印在法律页面上 - 它仅包含顶部前 3 页的金融邮票。因此，我们只需要为金融印章的空间设置前 3 页的大页边距和页面 rest 的默认页边距。我们正在使用 CYaHPConverter 进行 HTML -> PDF 转换，它不支持运行时 pdf ...

fo:region-body "xsl-region-body" 的边框和填充应该是 '0' 如果启用宽松验证，则允许使用非标准值 - Border and padding for fo:region-body "xsl-region-body" should be '0' non-standard values are allowed if relaxed validation is enabled

您好，我正在使用 fop 从 XML 文件生成一个 PDF Java 11 版本 Spring boot starter 2.5.2 org.apache.xmlgraphics (fop) 版本 2.7 我收到这个错误 org.apache.fop.fo.ValidationException ...

如何从用 Python 保存为 pdf 的复印件中提取文本 - How to extract text from a photocopy saved as a pdf in Python

我发现以下代码允许从 pdf 文件中提取文本。但是，这仅适用于 pdf，您可以在其中直接通过突出显示复制文本。我很好奇是否有某种方法可以从无法在 Python 中选择文本的文档中提取文本，例如保存为 pdf 的复印件或扫描文档？这是我用来从非影印 pdf 文件中获取文本的代码奇迹般有效。但 ...

iText7 文件流 Null C# 中的参考错误 - iText7 Filestream Null Reference Error in C#

我正在尝试将 html 文件转换为 pdf 文件。这是我的代码：运行代码“HtmlConverter.ConvertToPdf(htmlSource, pdfDest, converterProperties);” 导致抛出以下错误：我真的很茫然，因为这似乎是一个简单的操作。任何帮助将不胜感 ...

有没有办法从 Python/pandas 中的字符串中只删除坏字符？ - Is there way to remove only BAD characters from a string in Python/pandas?

我正在尝试使用 Camelot 库读取 PDF 并将其存储到数据框中。生成的数据框在字符串字段中有乱码/坏字符。例如： 123Rise – Tower & Troe 's Mech – 我只想删除乱码字符并保留包括符号在内的所有其他内容。我尝试了诸如 [^\w.,&,'- ...

隐蔽线性到pdf并打破许多页面 - covert linear to pdf and break many pages

我试图将线性转换为 pdf 文档。我想让它打破很多页面。帮我做 ...

无法将 pdf 页面转换为图像 - cannot convert pdf page to image

我想将 pdf 文件的每一页转换为新图像。为此，我使用 GhostScript.Net。问题是我无法弄清楚为什么 pageImage 在System.Drawing.Image pageImage = rasterizer.GetPage(dpi, i);中返回 null 线。这是我使用的方法 ...

Cairo PDF 在创建时未转换 unicode - Cairo PDF not converting unicode while creating

我正在使用 Python 的 Cairo PDF 库将 SVG 转换为 PDF。它适用于 ASCII 字符，但对于 Unicode 字符，它显示一个方框。有没有办法解决这个问题？ ...

将多个excel文件转换成python中的PDF文件 - Convert multiple excel files into PDF files in python

win32com package 在将单个 excel 文件转换为 pdf 时可以正常工作。但是当我在循环中运行它来转换多个 excel 文件时，它会失败并给出错误消息。 (-2147352567, 'Exception occurred.', (0, None, None, None, 0, ...

在反应中将文本和图像发布到 pdf - Posts text and image to pdf in react

我正在尝试创建一个博客帖子网站，任何人都可以在其中发布任何内容。而且任何用户都可以一键下载任何帖子。那么是否可以实现一个按钮来下载整个特定的帖子内容，除了侧边菜单和反应中的评论。 ...

我可以在 Spire.PDF 中为 .Net Standard 设置 DPI 吗？ - Can I set the DPI in Spire.PDF for .Net Standard?

我们正在将 package 从 .Net Framework 更新到 .Net Standard。我们可以使用指定 DPI 的 Spire.DPF SaveAsImage() 调用。但是，当下载标准 package 时，无法使用此调用设置 DPI。还有其他办法吗？ ...

SharePoint 文字自动化服务 - SharePoint Word Automation Services

在使用 Word Automation Service 转换 Z437175BA4191210EE004E1D9374 中的 Word 文件时，我在 SharePoint 2016 而不是 SharePoint 2019 上的问题上浪费了 2 个小时。在 2019 年，我可以更新目录，这仍然可以导 ...

EvoPdf.HtmlToPdf 不呈现外语（印地语、孟加拉语） - EvoPdf.HtmlToPdf isn't rendering foreign languages (Hindi, Bengali)

我正在使用带有付费许可证的 EvoPdf.HtmlToPdf，但是，我注意到当我将 HTML 转换为 PDF 并下载时，印地语、孟加拉语等某些语言无法正确呈现。这是我正在使用的代码片段。 Output： ...

Android 中的 PdfConverter 不会加载本地图像 - PdfConverter in Android won't load local images

我正在尝试使用存储在 memory 中的图像从 HTML 代码生成 pdf。 URI 正确且文件存在。使用 WebView，我们可以使用webView.getSettings().setAllowFileAccess(true); 为了允许它访问文件以正确管理它们，但是当涉及到PdfConver ...

超出上下文截止日期-goteberg api (/forms/libreoffice/convert) - Context deadline exceeded- goteberg api (/forms/libreoffice/convert)

我正在尝试使用 gotenberg api 将 ms-office 文件转换为 pdf。对于某些文件，我收到 unoconv PDF 上下文截止日期超过 503 状态。我已将读取、写入和处理超时增加到 60 秒。我该如何解决这个问题？转换文件所需的最长时间是多少？一个 gotenberg ...

ExportAsFixedFormat for VBA 保存文件 - ExportAsFixedFormat for VBA saving Files

我在保存一堆 pdf（从 WordDocuments 导出）的过程中遇到问题。我的程序的运行时行为有点奇怪，这就是我问的原因。所以我想将文件保存在全局驱动器上。在我的程序中，我创建了一个文件夹（在那个驱动器中）我放置了所有的 pdf。不知何故，如果我第一次执行此操作，它真的很慢。但是，如果 ...

关于 pdf 到 Node JS 图像转换的问题 - Questions regarding pdf to image conversion with Node JS

计划是创建一个 pdf 文件（仅包含一个页面），然后用户选择是下载为 PDF 还是图像。我已经编写了用于生成 PDF 的代码，它现在工作正常。现在的问题是如何将其转换为图像。是否可以在不安装 Ghostscript 等东西的情况下转换文件？我是一个完整的菜鸟，非常感谢您的建议。（关于使用 ...

将PDF转换为excel数据 - Convert PDF into excel data

我有一个 PDF，它附有以下数据作为图像。如何将其转换为 CSV/Excel 等表格格式？ ...

Converting XAML to PDF and Paginating it for a Xamarin.Forms UWP Project - Converting XAML to PDF and Paginating it for a Xamarin.Forms UWP Project

直到最近，我一直被困在如何在一个项目中实现将报告从StackLayout “导出”到 PDF 的目标上，我以某种方式退出了 Dev Limbo。 --背景故事-- 以前我曾尝试继续使用已放置的（在项目中） PDFSharp package 将 XAML 中提供的数据转换为客户的 PDF。长话短 ...

如何从带有 python 的文件夹中的 pdf 中提取文本并将它们保存在 dataframe 中？ - How to extract text from pdfs in folders with python and save them in dataframe?

我有很多文件夹，每个文件夹都有几个 pdf 文件（其他文件类型，如 .xlsx 或 .doc 也有）。我的目标是提取每个文件夹的 pdf 文本并创建一个数据框，其中每条记录都是“文件夹名称”，每列以字符串形式表示该文件夹中每个 pdf 文件的文本内容。我设法使用tika package（代码如 ...