繁体   English   中英

如何在pymupdf中实现PDF文件中Rect之前的文本

[英]How to achieve the text before Rect in PDF file in pymupdf

我正在尝试实现“______”所在的坐标。 我可以使用 MuPDF 轻松实现。 获得此矩形坐标后,我需要获取此矩形坐标之前的字符串或字符。

我的主要目标是阅读 PDF 文件,只要有用户输入,我就需要在那里绘制矩形并获取要在该用户输入中填充的数据。

我希望我听起来很清楚。

请看一下我到目前为止所做的代码。

import fitz

file = "real.pdf"

doc = fitz.open(file)

def searchTextAndHighLight(page):
  text = "_"
  text_instances = page.searchFor(text)
  i = 0
  for inst in text_instances:
    print(inst)
    print("<----------------------------------------->")
    i+=1
    highlight = page.addRectAnnot(inst)
  print(i)
  doc.save("output.pdf", garbage=4, deflate=True, clean=True)

  for page in doc:
    searchTextAndHighLight(page)

任何建议都非常欢迎来完成我的任务。 提前致谢

我和你有同样的问题。 尝试这个。 这个对我有用。

import fitz

file = "real.pdf"

doc = fitz.open(file)

def searchTextAndHighLight(page):
  text = "_"
  text_instances = page.searchFor(text)
  i = 0
  for inst in text_instances:
    print(inst)
    print("<----------------------------------------->")
    i+=1
    highlight = page.addRectAnnot(inst)
    highlight.setBlendMode(fitz.PDF_BM_Multiply)
    highlight.update()
  print(i)
  doc.save("output.pdf", garbage=4, deflate=True, clean=True)

for page in doc:
  searchTextAndHighLight(page)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM