繁体 English 中英

Solr PDF搜索：“转到页面”功能

[英]Solr PDF search: “Go to page” function

原文 2014-06-30 08:19:41 0 2 pdf/ solr/ lucene/ acrobat

我们正在使用Solr和Lucene构建PDF搜索机器，用户可以在其中搜索PDF文本。 该数据库仅包含PDF。

在搜索结果页面（“/ browse”）中，我们要使用#page = X附加PDF文件，其中X是找到文本的页面。 （如果使用锚标记指定，Adobe Acrobat会自动滚动到某个页面。）

例如，如果我搜索foobar并且有一个pdf文档，其中foobar位于第5页，则链接应为http://pdfserver/pdfs/pdf.pdf#page=5 （请注意末尾的锚点）。

这可能吗？
我们如何获得此页码？

2 个解决方案

我发现一个易于实现的解决方案是使用Adobe Reader在嵌入IE时支持的#search参数。

例如：

http://pdfserver/pdfs/pdf.pdf#search=foobar

然后Adobe Reader跳转到该页面。

当然，人们需要对搜索项进行URL编码。

Apache tika可以将PDF文件转换为结构化数据，以便您将其提供给solr服务器。

我对你的问题的处理方法是每页编制每个pdf索引，额外的字段链接到章节，文本标题（或绝对路径，或两者）和页码。使用此数据，您可以在相关页面打开相关文档。

在这里阅读更多关于tika的信息： http ： //tika.apache.org/

Solr pdf搜索突出显示问题

[英]solr pdf search highlighting issue

使用Solr索引/搜索PDF内容

[英]Index/Search PDF content with Solr

用Solr为带有页码的PDF编制索引

[英]Indexing PDF with page numbers with Solr

在solr中获取pdf的searchresult的页码

[英]Get page numbers of searchresult of a pdf in solr

使用cfsearch和SOLR进行ColdFusion PDF文件搜索非常慢

[英]ColdFusion PDF file search using cfsearch and SOLR extremely slow

如何通过链接将 go 到 iframe 中的特定 pdf 页面？

[英]How to go to a specific pdf page in iframe with a link?

转到打印页面并另存为pdf python

[英]Go to print page and save as pdf python

如何使用URL和go到PDF书签页

[英]how to use URL and go to PDF bookmark page

pdf中的搜索功能不适用于url

[英]search function in pdf not working on url

如何控制在UIWebView for iOS中加载的页面显示为PDF（转到页面）

[英]How to control page display to PDF loaded in UIWebView for iOS (go to page)

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Solr pdf搜索突出显示问题使用Solr索引/搜索PDF内容用Solr为带有页码的PDF编制索引在solr中获取pdf的searchresult的页码使用cfsearch和SOLR进行ColdFusion PDF文件搜索非常慢如何通过链接将 go 到 iframe 中的特定 pdf 页面？转到打印页面并另存为pdf python 如何使用URL和go到PDF书签页 pdf中的搜索功能不适用于url 如何控制在UIWebView for iOS中加载的页面显示为PDF（转到页面）

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM