簡體 English 中英

Solr PDF搜索：“轉到頁面”功能

[英]Solr PDF search: “Go to page” function

原文 2014-06-30 08:19:41 7 2 pdf/ solr/ lucene/ acrobat

我們正在使用Solr和Lucene構建PDF搜索機器，用戶可以在其中搜索PDF文本。 該數據庫僅包含PDF。

在搜索結果頁面（“/ browse”）中，我們要使用#page = X附加PDF文件，其中X是找到文本的頁面。 （如果使用錨標記指定，Adobe Acrobat會自動滾動到某個頁面。）

例如，如果我搜索foobar並且有一個pdf文檔，其中foobar位於第5頁，則鏈接應為http://pdfserver/pdfs/pdf.pdf#page=5 （請注意末尾的錨點）。

這可能嗎？
我們如何獲得此頁碼？

2 個解決方案

我發現一個易於實現的解決方案是使用Adobe Reader在嵌入IE時支持的#search參數。

例如：

http://pdfserver/pdfs/pdf.pdf#search=foobar

然后Adobe Reader跳轉到該頁面。

當然，人們需要對搜索項進行URL編碼。

Apache tika可以將PDF文件轉換為結構化數據，以便您將其提供給solr服務器。

我對你的問題的處理方法是每頁編制每個pdf索引，額外的字段鏈接到章節，文本標題（或絕對路徑，或兩者）和頁碼。使用此數據，您可以在相關頁面打開相關文檔。

在這里閱讀更多關於tika的信息： http ： //tika.apache.org/

Solr pdf搜索突出顯示問題

[英]solr pdf search highlighting issue

使用Solr索引/搜索PDF內容

[英]Index/Search PDF content with Solr

用Solr為帶有頁碼的PDF編制索引

[英]Indexing PDF with page numbers with Solr

在solr中獲取pdf的searchresult的頁碼

[英]Get page numbers of searchresult of a pdf in solr

使用cfsearch和SOLR進行ColdFusion PDF文件搜索非常慢

[英]ColdFusion PDF file search using cfsearch and SOLR extremely slow

如何通過鏈接將 go 到 iframe 中的特定 pdf 頁面？

[英]How to go to a specific pdf page in iframe with a link?

轉到打印頁面並另存為pdf python

[英]Go to print page and save as pdf python

如何使用URL和go到PDF書簽頁

[英]how to use URL and go to PDF bookmark page

pdf中的搜索功能不適用於url

[英]search function in pdf not working on url

如何控制在UIWebView for iOS中加載的頁面顯示為PDF（轉到頁面）

[英]How to control page display to PDF loaded in UIWebView for iOS (go to page)

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Solr pdf搜索突出顯示問題使用Solr索引/搜索PDF內容用Solr為帶有頁碼的PDF編制索引在solr中獲取pdf的searchresult的頁碼使用cfsearch和SOLR進行ColdFusion PDF文件搜索非常慢如何通過鏈接將 go 到 iframe 中的特定 pdf 頁面？轉到打印頁面並另存為pdf python 如何使用URL和go到PDF書簽頁 pdf中的搜索功能不適用於url 如何控制在UIWebView for iOS中加載的頁面顯示為PDF（轉到頁面）

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM