簡體   English   中英

認知中的不同類型的成像技術

[英]Different type of imaging techniques in kognitio

誰能解釋一下kognitio中可用的所有成像技術。

如果您涵蓋以下技術,那就太好了。

1)復制

2)替換分區圖像依據(column_name)

3)HASHED ON(column_name)分區圖像依據(column_name)

提前致謝。

此處的Kognitio社區論壇文章包含所有最新文檔的鏈接。

特別是,《 Kognitio指南》的第2章介紹了現有的各種表格和視圖圖像選項。

原始問題中提到的是:

  1. 復制 -在此對象的副本放置在每個ram存儲過程中。 這通常用於尺寸對象,以允許將它們連接到大型對象,而不管這些對象是隨機分布還是散列。
  2. 分區 (決定是否分區與您是否要復制/隨機/散列無關)-這允許ram存儲區在屬性上分區。 主要好處是可以在掃描時消除分區,從而減少了處理的數據量。 不過,請注意文檔中有關分區的更多注釋。
  3. 散列 -在屬性上進行散列可以根據該屬性值分配數據。 例如,在零售示例中,您可以通過customer_id對客戶表進行哈希處理,並對交易表進行相同的操作,然后任何給定的交易都與相關客戶記錄位於同一內存存儲區中。 請注意,此分布易於歪斜; 因此,請查閱文檔以獲取有關使用部分分布來克服偏斜的詳細信息。

WX2中有四個不同的“映像”選項隨機-均勻輪播(默認)散列-根據關鍵部分散列放置在RAM存儲上-散列,但處理傾斜屬性復制-每個RAM存儲上完整的副本

復制會將映像的副本放在每個RAM存儲中。 就RAM和重新分配時間而言,這可能會很昂貴。 適用於較小的查找/維表它不能被分段。 Theta聯接是必需的。 復制是按RAM存儲而不是每個節點進行的。

散列將表或視圖圖像的行分布在整個RAM存儲中。 它取決於一或多個列的值。 這對於聯接大表是很好的-公用鍵上的哈希。 這可能會導致歪斜。 不同值的數量小於RAM存儲的數量。 一個或兩個值在頻率上大大超過其他值。 偏分配可用於抵消價值偏差

當大型表在鍵列上嚴重偏斜時,部分散列是一種處理連接的機制。 它是直接哈希的替代方法。 類型為部分散列/隨機RAM存儲和部分散列/跨RAM存儲復制

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM