簡體   English   中英

使用Solr Cell搜索索引PDF時沒有結果

[英]No results when searching indexed PDF with Solr Cell

我已經與Solr合作了一段時間,最近我嘗試了solr-cell組件,並且正在為一些PDF編制索引,但是在此線程中存在完全相同的問題。

當我在管理控制台中搜索*:*時,將列出PDF。 但是,當我在PDF中搜索內容時,沒有任何結果。

我已經從給出的答案中嘗試了命令,但是沒有運氣,我仍然遇到相同的問題,我嘗試了不同的Solr版本(我使用的是3.5 btw),不同的PDF,更改了架構中的字段.xml,我已經在solrconfig.xml中修改了RequestHandlers,但似乎沒有任何效果。 任何幫助將不勝感激。

我終於明白了。 事實證明,fmap.content輸入參數存在問題。 我沒有在solrconfig.xml文件中的RequestHandler上直接聲明它,而是在用於索引PDF文件的curl命令中傳遞了它:

curl 'http://localhost:8080/solr/solrcell/update/extract?map.content=text&map.stream_name=id&commit=true' -F "file=@mccm.pdf"

我知道這種方法也應該起作用,但是如您所見,這里有一個“ map”而不是“ fmap”(我使用的是以前版本的solr的書示例)。

我選擇保留在solrconfig.xml文件中明確聲明的fmap輸入參數,以免出現任何問題:

<str name="fmap.content">text</str>


謝謝你的幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM