[英]No results when searching indexed PDF with Solr Cell
我已經與Solr合作了一段時間,最近我嘗試了solr-cell組件,並且正在為一些PDF編制索引,但是在此線程中存在完全相同的問題。
當我在管理控制台中搜索*:*時,將列出PDF。 但是,當我在PDF中搜索內容時,沒有任何結果。
我已經從給出的答案中嘗試了命令,但是沒有運氣,我仍然遇到相同的問題,我嘗試了不同的Solr版本(我使用的是3.5 btw),不同的PDF,更改了架構中的字段.xml,我已經在solrconfig.xml中修改了RequestHandlers,但似乎沒有任何效果。 任何幫助將不勝感激。
我終於明白了。 事實證明,fmap.content輸入參數存在問題。 我沒有在solrconfig.xml文件中的RequestHandler上直接聲明它,而是在用於索引PDF文件的curl命令中傳遞了它:
curl 'http://localhost:8080/solr/solrcell/update/extract?map.content=text&map.stream_name=id&commit=true' -F "file=@mccm.pdf"
我知道這種方法也應該起作用,但是如您所見,這里有一個“ map”而不是“ fmap”(我使用的是以前版本的solr的書示例)。
我選擇保留在solrconfig.xml文件中明確聲明的fmap輸入參數,以免出現任何問題:
<str name="fmap.content">text</str>
謝謝你的幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.