簡體   English   中英

使用pdf2htmlEx工具將pdf轉換為html時字體未對齊

[英]Font misalignment during pdf to html conversion using pdf2htmlEx tool

從PDF到HTML轉換的字體問題

  1. 缺少所有“ ti”,“ fi”,“ tt”字符

樣本畫面

  1. 字體重疊問題

樣本畫面

  • 注意:我沒有用Firefox遇到此問題。 在Safari瀏覽器中的Chrome中獲取上述問題

我在用

  • 使用pdf2htmlEX的0.13.6版本
  • 使用以下命令將pdf轉換為html

pdf2htmlEX-拆分頁面1-縮放3-適合寬度920-正確文本可見性1-目標目錄$ 1 $ 2 2>&1

試過

使用--fallback 1選項可以解決上述所有問題。

  1. 后備選項降低了文檔的清晰度。
  2. 頁面中的表消失了,取而代之的是空白。

懷疑

  1. 您能否解釋一下有關備用廣告的更多信息?

  2. 我已經嘗試了以上一種(使用后備)。 如果您希望采用其他方法來解決上述字體問題,請提出建議。

使用chrome和safari可以解決上述問題,而在Firefox中可以正常工作。

僅在-chrome和safari之類的webkit Web瀏覽器-提供對連字的支持-而像firefox之類的瀏覽器卻沒有這種情況時,才會發生上述問題。

連字是兩個或多個字母組合成單個字形的組合

根本原因

缺少字符的問題是由於這些現代瀏覽器提供的連字支持-讓我解釋一下

1.轉換時的工具-它使用poppler將字符轉換為字形以進行渲染-現在這些瀏覽器遇到諸如tt tf ff ff之類的字符時,會認為它們是連字並搜索與tt而不是tt對應的字形

2.由於它們沒有對應的字形-他們只是跳過字符並渲染其余字符-因此,我們發現缺少的字符

可以解決

在這些瀏覽器中禁用/關閉連字-將CSS嵌入到生成的內容中

有關更多詳細信息,請參閱:

如果我錯了,請糾正我。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM