当我尝试运行pdf2json (根本没有任何参数)时,出现此错误: 这是我尝试运行它的 Dockerfile: 有任何想法吗? ...
当我尝试运行pdf2json (根本没有任何参数)时,出现此错误: 这是我尝试运行它的 Dockerfile: 有任何想法吗? ...
我的目标是在预定义文本之后获取某个字符串。 在这种情况下,我想阅读以下值: 我发现这可以使用正则表达式,因此我尝试了这个: 我收到我的数组位于位置 1 null 的错误: 无法读取 null 的属性“1” 谢谢 ...
起初,我为我糟糕的英语道歉:D 您好,我有以下情况让我很感兴趣,我在 react 中有一个前端,在 node 中有一个后端,它通过 express 接收请求。 这个想法是,从前端我使用 POST 方法发送一个 pdf 文件,后端处理这个文件进行必要的处理(将页面分成更多文件并在 pdf 中获取数据 ...
我试过 pdf2json: 但它给出了未知单位的尺寸! 以像素为单位的尺寸将帮助我将它们包含在 pdf-poppler 模块中,该模块将 pdf 文件转换为图像,它需要以像素为单位的 pdf 文件高度。 ...
我尝试安装 tabula-js 库,但由于它是一个 js 库,我不知道如何将它集成到适用于 ts 的 angular 中。 另外,如果不是这样,那么有什么方法可以通过坐标从渲染的 pdf 文档中提取 select 特定部分,然后使用它来提取数据。 我基本上需要制作一个 pdf 到 json 提取 ...
我正在尝试解析 pdf 并根据文本格式/装饰对信息进行分类。 你建议我怎么做? 例如,我有一个 pdf,其中结构重复: S.No. BOLD+UNDERLINED TITLE para S.No. BOLD+UNDERLINED TITLE para 如何根据文本修饰将此数据分类为对象数组: ...
我成功地实现了 pdf2json 以使用节点从 url 获取和读取 pdf。 However, Azure function is an async function and finishes execution before pdfPipe.on("pdfParser_dataReady", ...