繁体 English 中英

将SOLR与Web项目一起使用的最佳方法是什么？

[英]What's the best approach for using SOLR with web projects?

原文 2009-11-10 02:10:47 2 2 search/ indexing/ solr

好吧，我是SOLR和Lucene的新手，但是已经让Solr在Tomcat 6.x下运行开箱即用，并且刚刚完成了一些基本的Wiki条目。

我有几个问题，也需要一些建议。

Solr可以索引文件（XML，CSV）中的数据，也可以索引DB。 您是否也可以将其指向URI /域，并让它以谷歌的方式为网站编制索引？
如果我的网站有“页面”数据，那么“页面名称”，“页面内容”等，以及“产品数据”，那么“产品名称”，“SKU”等，我是否需要两个不同的Schema.xml文件？ 如果是这样，这是否意味着两个不同的Solr实例？

最后，如果你有一个包含大型关系数据库和规范化数据库的项目，你会说下面3个选项的最佳方法是什么？：

在后台运行中间件服务，该服务挖掘数据库并手动创建相关的XML文件，然后发送到SOLR
让SOLR直接索引DB。 在这种情况下，最好只将SOLR指向视图，这将抽象所有表关系？
还有其他我不知道的选择吗？

上下文：我们运行的是Windows 2003环境，.NET 3.5，SQLServer 2005/2008

干杯！

2 个解决方案

不，你需要一个爬虫，例如Nutch
是的，您需要两个单独的索引（=两个schema.xml），因为数据集似乎不相关。 这并不意味着Solr的两个实例，您可以使用Cores管理这两个索引。

至于填充Solr索引，它取决于您的特定项目，例如，它是否可以容忍陈旧数据，还是必须绝对新鲜。

索引数据的其他选项包括：

数据库触发器
如果您正在使用某种ORM，请使用其拦截功能。 例如，您可以使用NHibernate事件来更新，插入或删除索引。 如果你使用NHibernate和SolrNet，这将自动处理

我认为毛里西奥对他的建议已经死了。 我要做的唯一一点就是决定拥有一个“中间件”索引器，或者直接使用数据库。 如果您的数据库（或视图？）非常接近Solr架构所需的内容，那么DIH非常棒。 但是，如果您要从多个数据源编制索引，或者您必须了解数据库中的数据以满足Solr所需的数据，那么拥有专用的中间件索引器会更好。

Solr相关性和最佳方法

[英]Solr relevancy & boosting best approach

最好的搜索方法是什么？

[英]What is the best search approach?

在Solr中为〜1TB富文本索引编制索引的最佳方法是什么？

[英]What's the best way to index ~1TB of richtext douments in Solr?

使用关键字表的mysql搜索…最佳方法

[英]mysql search using a keyword table… best approach

这个Solr范围过滤器查询有什么问题？

[英]What's wrong with this Solr range filter query?

创建基于Solr的重复数据删除系统的最佳实践是什么？

[英]What are the best practices to create a solr based de-duplication system?

MySQL将排名最高与最低匹配的最佳方法是什么？

[英]MySQL what would the best approach to ranking highest to lowest possible match?

在超过1（多个）“ std :: map”或“ std :: set”中找到密钥的最佳方法？

[英]Best approach to find a key in more than 1 (multiple) 'std::map's or 'std::set's?

在数组中查找数字的最佳做法是什么？

[英]What's best practice for finding a number in an array?

在任何电子商务中实施流行产品“分类”的最佳方法是什么？

[英]What is best approach to implement a popular product `sorting` in any e-commerce?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Solr相关性和最佳方法最好的搜索方法是什么？在Solr中为〜1TB富文本索引编制索引的最佳方法是什么？使用关键字表的mysql搜索…最佳方法这个Solr范围过滤器查询有什么问题？创建基于Solr的重复数据删除系统的最佳实践是什么？ MySQL将排名最高与最低匹配的最佳方法是什么？在超过1（多个）“ std :: map”或“ std :: set”中找到密钥的最佳方法？在数组中查找数字的最佳做法是什么？在任何电子商务中实施流行产品“分类”的最佳方法是什么？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM