簡體   English   中英

如何判斷特定字體是否包含PDF :: API2中的特定字符

[英]How to tell whether a particular font includes a particular character in PDF::API2

我在我的Perl應用程序中使用PDF::API2將OCR輸出嵌入到相應的圖像后面,允許搜索生成的PDF,因為可以使用pdftotext提取OCR輸出。

此時,只要應用程序在OCR輸出中看到非ASCII字符,它就會從PDF核心字體切換到TTF。 然而,這真的很酷,因為核心字體包括大多數西歐角色。 TTF僅適用於希臘語,俄語,日語等。

如何判斷特定字體是否包含特定字符(包括CMAP表以便使用pdftotext提取)?

您是否嘗試過字形特定的方法?

http://search.cpan.org/dist/PDF-API2/lib/PDF/API2/Resource/BaseFont.pm#GLYPH_RELATED_METHODS

如果不這樣做,也許渲染字形(到一個單獨的文檔)並測量它?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM