![](/img/trans.png)
[英]how does spark push down filter work with cassandra table non partition keys?
[英]How to partition on cassandra table on timestamp?
我有這樣的桌子
CREATE TABLE ks.log_by_date (
column_name text,
status text,
error_msg text,
last_update_date date,
last_update_timestamp timestamp,
updated_user text,
PRIMARY KEY (( column_name), last_update_date)
) WITH CLUSTERING ORDER BY ( last_update_date DESC );
INSERT INTO ks.log_by_date (column_name,last_update_date,error_msg,last_update_timestamp,status,updated_user)
VALUES ('column_log_by_date','2018-10-23','NONE',1540302120001,'ERROR','user1');
INSERT INTO ks.log_by_date (column_name,last_update_date,error_msg,last_update_timestamp,status,updated_user)
VALUES ('column_log_by_date','2018-10-23','NONE',1540302340001,'SUCCESS','user1');
當我基於“last_update_timestamp”列插入兩列時,具有不同的時間戳 1540302120001 和 1540302340001,該行被覆蓋。
我在這里做錯了什么? 為什么它覆蓋行而不是兩個單獨的行。 我怎樣才能在此處插入兩行...基於 last_update_timestamp
你的幫助是非常有意義的。
如果您希望將具有不同last_update_timestamp
的 2 行計為單獨的行,則需要將last_update_timestamp
放入主鍵中,作為聚類列:
PRIMARY KEY (( column_name), last_update_date, last_update_timestamp)
但我不知道 - 你真的需要有last_update_date
嗎? 您是否需要選擇具有特定last_update_date
的所有行?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.