簡體   English   中英

使用Python識別書簽

[英]Identifying Bookmarks using Python

我正在研究PyPDF2,以便從pdf閱讀書簽。

任何人都可以向我指出正確的方向,即如何從pdf讀取書簽,然后基於pdf拆分。 我敢肯定,一旦我知道如何識別書簽,我就能弄清楚如何拆分。

謝謝

我花了相當長的時間才弄清楚這一點,所以我在這里回答,因為這可能對其他人有所幫助。

大綱包含目標的嵌套列表( Destination Class的定義

您可以使用以下方法獲取pdf大綱:

from PyPDF2 import PdfFileReader

reader = PdfFileReader(pdf)
reader.outlines

對於每個帶有子標題的標題,父標題位於“目標”對象中,后跟子標題列表作為“目標”對象列表。

parent_destination
[child_destination1, child_destination2, ......]

如果沒有子標題,則后面跟一個同級目的地,而不是列表。

destination1
destination2

每個目的地包含

  • 標題:標題的文字內容
  • 頁面:頁碼
  • 其他性質

可用於拆分pdf。

希望這可以幫助。

看起來PyPDF2具有您需要的功能。 您可能會發現您需要這篇文章

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM