簡體   English   中英

在Apache Spark中檢索Cassandra分區數據

[英]Retrieve Cassandra partition data in Apache Spark

我的數據按Cassandra上的分區鍵井井有條。 我想在Spark中檢索此數據並保留相同的分區。

我的目標是避免很大的洗牌。

PS:我正在使用Cassandra 2.1和Spark 1.5

Spark Cassandra連接器將C *令牌范圍讀入Spark分區。 這意味着任何給定的Cassandra分區鍵的所有值都將在同一Spark分區中。

https://academy.datastax.com/demos/how-spark-cassandra-connector-reads-data

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM