繁体   English   中英

Solr索引错误 - 可能的分析错误

Solr indexing error - possible analysis error

提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供   中文繁体   英文版本   中英对照 版本,有任何建议请联系yoyou2525@163.com。

我刚收到Solr 6.6.1索引错误。 你能帮忙弄清楚这是否是Solr缺陷? 或者只是我的配置问题?

当我删除停用词“pm”时,索引就可以了。 我猜禁闭词过滤器做了一些使SynonymGraphFilter出现问题的东西。

我用于编制索引的价值是 “星期五:星期六下午7:00-11:30:下午1:30-4:00和星期日下午7:00-11:30”。

我使用的架构

<field indexed="true" multiValued="false" name="my_field" type="my_field_type" omitNorms="true" omitPositions="false" omitTermFreqAndPositions="false" storeOffsetsWithPositions="true" stored="true" termVectors="false"/>

<fieldType class="solr.TextField" name="my_field_type" positionIncrementGap="100">
      <analyzer>
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.ASCIIFoldingFilterFactory"/>
        <filter class="solr.WordDelimiterGraphFilterFactory"
            generateWordParts="1" generateNumberParts="1"
            catenateWords="1" catenateNumbers="1"
            catenateAll="1" splitOnCaseChange="0"
            stemEnglishPossessive="1" preserveOriginal="1"/>
        <filter class="solr.FlattenGraphFilterFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
        <filter class="solr.SynonymGraphFilterFactory" expand="true" ignoreCase="true" synonyms="synonyms.txt"/>
    <filter class="solr.FlattenGraphFilterFactory"/>
  </analyzer>
</fieldType>

在stopwords.txt内: pm

在synonyms.txt里面: qweasdzxc => abc

Solr日志的错误消息

org.apache.solr.common.SolrException: Exception writing document id 312310-003690 to the index; possible analysis error.
    at         org.apache.solr.update.DirectUpdateHandler2.addDoc(DirectUpdateHandler2.java:206)
at     org.apache.solr.update.processor.RunUpdateProcessor.processAdd(RunUpdateProcessorFactory.java:67)
at     org.apache.solr.update.processor.UpdateRequestProcessor.processAdd(UpdateRequestProcessor.java:55)
at org.apache.solr.update.processor.DistributedUpdateProcessor.doLocalAdd(DistributedUpdateProcessor.java:979)
at     org.apache.solr.update.processor.DistributedUpdateProcessor.versionAdd(DistributedUpdateProcessor.java:1192)
at org.apache.solr.update.processor.DistributedUpdateProcessor.processAdd(DistributedUpdateProcessor.java:748)
at org.apache.solr.update.processor.LogUpdateProcessorFactory$LogUpdateProcessor.processAdd(LogUpdateProcessorFactory.java:103)
at org.apache.solr.handler.dataimport.SolrWriter.upload(SolrWriter.java:80)
at org.apache.solr.handler.dataimport.DataImportHandler$1.upload(DataImportHandler.java:254)
at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:526)
at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:414)
at org.apache.solr.handler.dataimport.DocBuilder.doFullDump(DocBuilder.java:329)
at org.apache.solr.handler.dataimport.DocBuilder.execute(DocBuilder.java:232)
at org.apache.solr.handler.dataimport.DataImporter.doFullImport(DataImporter.java:415)
at org.apache.solr.handler.dataimport.DataImporter.runCmd(DataImporter.java:474)
at org.apache.solr.handler.dataimport.DataImporter.lambda$runAsync$0(DataImporter.java:457)
at java.lang.Thread.run(Unknown Source)

Caused by: java.lang.IndexOutOfBoundsException: Index: 2, Size: 2
at java.util.ArrayList.rangeCheck(Unknown Source)
at java.util.ArrayList.get(Unknown Source)
at org.apache.lucene.analysis.core.FlattenGraphFilter.releaseBufferedToken(FlattenGraphFilter.java:204)
at org.apache.lucene.analysis.core.FlattenGraphFilter.incrementToken(FlattenGraphFilter.java:258)
at org.apache.lucene.analysis.synonym.SynonymGraphFilter.parse(SynonymGraphFilter.java:332)
at org.apache.lucene.analysis.synonym.SynonymGraphFilter.incrementToken(SynonymGraphFilter.java:199)
at org.apache.lucene.analysis.core.FlattenGraphFilter.incrementToken(FlattenGraphFilter.java:268)
at org.apache.lucene.index.DefaultIndexingChain$PerField.invert(DefaultIndexingChain.java:746)
at org.apache.lucene.index.DefaultIndexingChain.processField(DefaultIndexingChain.java:447)
at org.apache.lucene.index.DefaultIndexingChain.processDocument(DefaultIndexingChain.java:403)
at org.apache.lucene.index.DocumentsWriterPerThread.updateDocument(DocumentsWriterPerThread.java:232)
at org.apache.lucene.index.DocumentsWriter.updateDocument(DocumentsWriter.java:478)
at org.apache.lucene.index.IndexWriter.updateDocument(IndexWriter.java:1571)
at org.apache.solr.update.DirectUpdateHandler2.updateDocument(DirectUpdateHandler2.java:924)
at org.apache.solr.update.DirectUpdateHandler2.updateDocOrDocValues(DirectUpdateHandler2.java:913)
at org.apache.solr.update.DirectUpdateHandler2.doNormalUpdate(DirectUpdateHandler2.java:302)
at org.apache.solr.update.DirectUpdateHandler2.addDoc0(DirectUpdateHandler2.java:239)
at org.apache.solr.update.DirectUpdateHandler2.addDoc(DirectUpdateHandler2.java:194)
... 16 more
问题暂未有回复.您可以查看右边的相关问题.
1 索引编制时出现Solr错误

当我在solr中索引数据时,出现异常 我知道此异常是关于什么的,但是我如何知道哪个字段导致此错误。 是否有任何日志记录可以告诉我哪个字段的数据有问题? 谢谢, ...

2012-05-30 03:56:18 0 696   solr
2 Solr索引显示错误

我已经在RHEL 7中安装了solr 6.4。 我创建了一个名为PLI的核心。 我正在尝试使用以下命令导入csv文件并建立索引: 但是显示以下错误: 我已经将csv文件“ StreetNo”提交了。 我在manged-schmea中添加了我的架构,如下所示: 我无法 ...

3 DateType Solr索引错误

我使用DSE 3.2.0。 当我尝试在Solr的DateType列中建立索引(系统区域设置为GMT + 3)时,出现以下SOLR异常: 架构如下: ...

6 在solr中建立文档索引时出错-SolrException

我正在使用以下代码来索引solr服务器中的文档。 在执行此代码时,我遇到以下异常。 异常: org.apache.solr.common.SolrException 异常消息: 异常跟踪: 任何帮助都会有用 ...

2015-10-28 12:11:14 2 567   solr
7 发布文件时出现Solr索引错误

我正在尝试发布一个csv文件进行索引。这是文件格式: 它索引前两行,但之后显示错误: solr在无模式模式下工作。 注意:实际的csv文件大小非常大。 这些是我可以在管理模式文件中找到的字段: ...

2017-11-03 07:35:18 1 107   csv/ solr
8 索引数据时出现Solr重复数据删除错误

我已经将nutch 2.3.1与solr 6.5集成在一起,这样我就可以将数据推送到solr并获取索引。 现在,我想删除重复的元素,为此,我在schema.xml和solrconfig.xml中进行了修改。 但是在索引bin / nutch solrindex http:// loca ...

9 索引时Nutch 2.3.1和Solr 6错误

我尝试索引时收到此错误: IndexingJob:启动SolrIndexerJob:java.lang.RuntimeException:job failed:name = apache-nutch-2.3.1.jar,jobid = job_local1960263394_0001 ...

10 Typo3中的Solr索引给出错误

当我尝试索引页面时,在solr管理员屏幕中出现错误 typo3开发人员日志显示以下内容: 我已经配置了solr扩展名,并根据typo3 admin上的“状态报告”页面进行了设置,但是显示错误并且没有任何索引。 有人可以建议在设置solrconfig.xml和schema.x ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2021 STACKOOM.COM