簡體   English   中英

一個solr集合下是否可能具有包含集合模式的字段子集的文檔?

[英]Is it possible to have documents with a subset of fields of the collection's schema under one solr collection?

我們有4個不同的數據集,並希望對其進行多面搜索。 我們目前正在使用SolrCloud,並在將它們索引到Solr之前將這些數據集展平。 即使我們有關系數據,我們的主要目標還是分面搜索,而Solr似乎是正確的選擇。

我們數據的粗略結構:

Dataset1(col1, col2, col3,col4)
Dataset2(col1,col6,col7,col8)
Dataset3(col6,col9,col10)

展平的數據集: dataset(col1,col2,col3,col4,col6,col7,col8,col9,col10)

最后,我們將它們展平為具有一個通用結構,並在不存在值的地方使用null。 到目前為止,Solr運作良好。

問題:現在我們有了其他數據集,每個數據集都有大約50-60列。 從技術上講,我仍然可以使這些變平,但是我認為這不是一個好主意。 我知道我可以為每個數據集使用不同的架構使用不同的集合。 但是,我們在這些文檔上執行分組依據,因此我們需要一個模式。

有什么方法可以在一個集合中維護帶有模式字段子集的文檔,而無需對其進行展平? 如果不是,是否有更好的解決方案?

例如:

DocA(field1, field2) DocB(field3,field4). 
Schema(field1, field2, field3, field4).

使用上述架構,我們可以在一個集合下擁有DocA和DocB嗎?

我們的后端位於Cloudera Hadoop(CDH4.6和5.2)分發之上,我們可以選擇屬於Hadoop生態系統的任何工具作為可能的解決方案。

當然可以,他們只需要為每個文檔使用不同的唯一鍵即可。 如果定義了固定的Solr模式,則動態字段可能會為您提供幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM