如何在Cassandra中使用Spark獲取行范圍

Question

我在卡桑德拉有一張桌子，它的結構是這樣的

CREATE TABLE dmp.Table (

pid text PRIMARY KEY,
day_count map<text, int>, 
first_seen map<text, timestamp>, 
last_seen map<text, timestamp>, 
usage_count map<text, int>
}

現在，我正在嘗試使用spark-cassandra驅動程序查詢它，那么有什么地方可以獲取數據塊。 就像我有100行一樣，我應該能夠得到0-10行，然后是10 -20，依此類推。

 CassandraJavaRDD<CassandraRow> cassandraRDD = CassandraJavaUtil.javaFunctions(javaSparkContext).cassandraTable(keySpaceName, tableName);

我問這個問題是因為我的表中沒有列，我可以使用IN子句查詢以獲取行范圍。

Answer 1

您可以添加自動遞增的ID列-請參閱我的DataFrame定義的帶索引的Zip解決方案。 然后，您可以通過新創建的id列進行查詢：

SELECT ... WHERE id >= 0 and id < 10;

等等。

如何在Cassandra中使用Spark獲取行范圍

問題描述

1 個解決方案

解決方案1
1 已采納 2016-03-17 11:19:55

如何在Cassandra中使用Spark獲取行范圍

問題描述

1 個解決方案

解決方案1 1 已采納 2016-03-17 11:19:55

解決方案1
1 已采納 2016-03-17 11:19:55