如何在pymupdf中实现PDF文件中Rect之前的文本

Question

我正在尝试实现“______”所在的坐标。 我可以使用 MuPDF 轻松实现。 获得此矩形坐标后，我需要获取此矩形坐标之前的字符串或字符。

我的主要目标是阅读 PDF 文件，只要有用户输入，我就需要在那里绘制矩形并获取要在该用户输入中填充的数据。

我希望我听起来很清楚。

请看一下我到目前为止所做的代码。

import fitz

file = "real.pdf"

doc = fitz.open(file)

def searchTextAndHighLight(page):
  text = "_"
  text_instances = page.searchFor(text)
  i = 0
  for inst in text_instances:
    print(inst)
    print("<----------------------------------------->")
    i+=1
    highlight = page.addRectAnnot(inst)
  print(i)
  doc.save("output.pdf", garbage=4, deflate=True, clean=True)

  for page in doc:
    searchTextAndHighLight(page)

任何建议都非常欢迎来完成我的任务。 提前致谢

Answer 1

我和你有同样的问题。 尝试这个。 这个对我有用。

import fitz

file = "real.pdf"

doc = fitz.open(file)

def searchTextAndHighLight(page):
  text = "_"
  text_instances = page.searchFor(text)
  i = 0
  for inst in text_instances:
    print(inst)
    print("<----------------------------------------->")
    i+=1
    highlight = page.addRectAnnot(inst)
    highlight.setBlendMode(fitz.PDF_BM_Multiply)
    highlight.update()
  print(i)
  doc.save("output.pdf", garbage=4, deflate=True, clean=True)

for page in doc:
  searchTextAndHighLight(page)

如何在pymupdf中实现PDF文件中Rect之前的文本

问题描述

1 个解决方案

解决方案1
0 2020-06-18 03:30:49

如何在pymupdf中实现PDF文件中Rect之前的文本

问题描述

1 个解决方案

解决方案1 0 2020-06-18 03:30:49

解决方案1
0 2020-06-18 03:30:49