[英]How to tell whether a particular font includes a particular character in PDF::API2
我在我的Perl應用程序中使用PDF::API2
將OCR輸出嵌入到相應的圖像后面,允許搜索生成的PDF,因為可以使用pdftotext
提取OCR輸出。
此時,只要應用程序在OCR輸出中看到非ASCII字符,它就會從PDF核心字體切換到TTF。 然而,這真的很酷,因為核心字體包括大多數西歐角色。 TTF僅適用於希臘語,俄語,日語等。
如何判斷特定字體是否包含特定字符(包括CMAP表以便使用pdftotext
提取)?
您是否嘗試過字形特定的方法?
http://search.cpan.org/dist/PDF-API2/lib/PDF/API2/Resource/BaseFont.pm#GLYPH_RELATED_METHODS
如果不這樣做,也許渲染字形(到一個單獨的文檔)並測量它?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.