[英]Spark on Cassandra : is there a way to remove data by partition key?
[英]Retrieve Cassandra partition data in Apache Spark
我的數據按Cassandra上的分區鍵井井有條。 我想在Spark中檢索此數據並保留相同的分區。
我的目標是避免很大的洗牌。
PS:我正在使用Cassandra 2.1和Spark 1.5
Spark Cassandra連接器將C *令牌范圍讀入Spark分區。 這意味着任何給定的Cassandra分區鍵的所有值都將在同一Spark分區中。
https://academy.datastax.com/demos/how-spark-cassandra-connector-reads-data
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.