簡體   English   中英

使用MuPDF從PDF提取文本時,文本的最后一行被截斷

[英]Last line of text cut off when extracting text from PDF using MuPDF

我正在使用MuPDF從pdf文件中提取一些文本。 在大多數情況下,它工作正常,但有時最后一行不會提取或無法打印。

fz_text_sheet *sheet = fz_new_text_sheet(self.ctx);
fz_text_page *text = fz_new_text_page(self.ctx, &fz_empty_rect);
fz_device *dev = fz_new_text_device(self.ctx, sheet, text);

fz_page *page = fz_load_page(self.doc, pageNumber);
fz_run_page(self.doc, page, dev, &fz_identity, NULL);

fz_output *out = fz_new_output_file(ctx, stdout);
fz_print_text_page_html(ctx, out, text);

PDF的第一頁無法在該頁上打印最后一行文本。

我是在做錯什么還是錯誤?

謝謝!

您需要釋放文本設備,然后才能安全地使用fz_text_page。 可能有一些東西在設備中緩沖,直到釋放后才會刷新。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM