[英]Spark on Cassandra : is there a way to remove data by partition key?
spark Cassandra 連接器具有RDD.deleteFromCassandra(keyspaceName, tableName)
方法。
RDD 中的值被解釋為主鍵約束。
我有一張這樣的桌子:
CREATE TABLE table (a int, b int, c int, PRIMARY KEY (a,b));
如您所見, a
是partition key
, b
是clustering key
。
我需要有一個通過partition_key
有效刪除的spark app
,而不是通過primary key
。
事實上,我的目標是始終按partition keys
刪除整個分區,而不是為每個primary key
創建一個tombstones。
如何使用火花連接器做到這一點?
謝謝
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.