[英]solr delta-import “fetches” all data before “processing”?
我使用solr的DIH从mysql到solr增量导入数据,但是我发现当表中有大量记录(100000000)时,增量导入需要在处理之前获取所有数据。 因此,它总是会导致大量内存消耗,从而导致内存不足 。 当我执行完全导入操作时,它可能会提取部分数据。
solr delta导入上是否有任何设置可以解决此问题?
一种解决方案可能是在data-config.xml
设置batchSize
。 这是有关如何执行此操作的示例:
<dataSource type="JdbcDataSource" name="ds-2" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:8889/mysqldatabase" batchSize="-1" user="root" password="root"/>
本示例来自以下链接: DataImportHandler-Solr Wiki
您可能要尝试的另一件事是对您的增量使用full-import
命令,但是过去,设置batchSize
对我batchSize
。 如果要尝试对增量使用full-import
,请访问以下链接: 完全导入增量-Solr Wiki
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.