簡體   English   中英

如何獲得對特定pdf信息的訪問?

[英]How to gain access to specific pdf informations?

我有一個正在進行的項目,需要從Science PDF文檔中過濾掉以下信息。 作者,標題和參考。 從PDF文檔中獲取這些特定信息存在幾個問題。 1.寫論文沒有特定的方法,所以每篇論文看起來都不一樣。 2.對於程序,很難區分名稱和實際描述的對象。 還有更多問題,但這會使我們離我的實際問題太遠。 我的問題是,是否可以選擇獲取Pdf文檔中某些信息的權限,例如該pdf中使用了哪種字體大小或使用了哪種不同的字體? 有什么方法或編輯器可以讓我以可理解的方式在pdf內查看,以便我也許可以在我需要的信息周圍找到標志性功能。 這樣我就可以將algorythem正確提取出來。 謝謝您的幫助。 我很抱歉我的英語不是我的母語。

您可以使用諸如Apache PDFBox之類的SDK來讀取PDF文件的屬性以及其他文件內容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM