[英]Does spark-cassandra-connector support built-in load balanceing?
[英]Lazy cassandra load with spark
我想知道在Lazy模式下加載cassandra表是否是一個好習慣,然后使用where子句。
例如:
Lazy val table = sparkContext.cassandraTable[Type](keyspace,tableName)
---代碼的其他部分---
table.where("column = ?",param)
謝謝!
默認情況下,所有RDD都是惰性的。 在你召集行動之前,他們實際上不會做任何事情。 所以不要添加延遲,因為這只會延遲圍繞RDD創建元數據而不會實際影響執行。
例
val table = sparkContext.cassandraTable[Type](keyspace,tableName)
val tableWithWhere = table.where("x = 5")
val tableTransformed = table.map( x:Type => turnXIntoY(x) )
//nothing has happened in C* or Spark on executors yet
tableTransformed.collect // This causes spark to start doing work
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.