簡體   English   中英

Cassandra數據建模問題

[英]Cassandra Data Modelling issue

您能幫我在下面的表格中建模嗎?我被困在這里。 我的分區鍵是agent_id ,群集列是rowid 每個代理程序最多可以有1000行到10M,這取決於代理程序的繁忙程度。 我忙碌的座席面臨大分區問題。

我在這里使用SizeTieredCompaction。該表具有Writes / Reads(70/30比率),並且在表中也有agent_id刪除的內容。

CREATE TABLE IF NOT EXISTS XXX (
 agent_id UUID,
 row_id BIGINT,
 col_a TEXT,
 col_b TEXT,
 col_c TEXT,
 PRIMARY KEY (agent_id,row_id)
)

在C *中建模時,會多次出現此問題。

  1. 如果任何列( col_acol_b等)與時間有關,並且您知道每個座席每天要插入多少行(大約),我強烈建議將year-month-day作為分區鍵(如果一天足夠,那么請轉到小時或分鍾)。

  2. 您可以對agent_id + row_id以1M為模進行某種哈希處理(例如)。 該哈希可以是分區鍵,您可以在插入和/或檢索之前在應用程序中進行哈希。 這樣,您知道如果估計的行數為10M,則分區的大小將為10。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM