Apache Solr PDF索引

Question

每當應用程序上傳pdf文件時，我都希望為其編制索引。 在編制索引時，我在url發送filename和filename fileType ，如下所示

http://localhost:8983/solr/update/extract?stream.file=/D:\apache-solr-3.3.0\example\exampledocs\Accessing_MySQL_from_IntalioBPMS.pdf&stream.contentType=application/pdf&literal.id=111&literal.fileName=Test.pdf&literal.fileType=pdf&commit=true

我的schema.xml文件中也有字段fileName和fileType 。

我索引PDF文檔后，我做它顯示了搜索只是content和id的的pdf文檔，但沒有filename和filetype 。

我做錯了什么？

Answer 1

定義架構時，必須指定要存儲的字段（或在搜索時可檢索的字段）。 在這種情況下，您的文件名和文件類型字段可能僅被索引而不被存儲。

確保您的架構如下所示：

<field name="filename" type="{yourDesiredType}" indexed="true" stored="true" /> <field name="filetype" type="{yourDesiredType}" indexed="true" stored="true" />

有關編輯schema.xml更多信息，請訪問http://wiki.apache.org/solr/SchemaXml 。

Apache Solr PDF索引

問題描述

1 個解決方案

解決方案1
1 2011-09-08 13:51:44

Apache Solr PDF索引

問題描述

1 個解決方案

解決方案1 1 2011-09-08 13:51:44

解決方案1
1 2011-09-08 13:51:44