火花卡桑德拉调音

Question

如何在Spark Scala代码中为版本-DataStax Spark Cassandra Connector 1.6.3设置以下Cassandra写参数。

Spark版本-1.6.2

spark.cassandra.output.batch.size.rows

spark.cassandra.output.concurrent.writes

spark.cassandra.output.batch.size.bytes

spark.cassandra.output.batch.grouping.key

谢谢，钱德拉

Answer 1

在DataStax Spark Cassandra Connector 1.6.X中，您可以将这些参数作为SparkConf一部分进行SparkConf 。

val conf = new SparkConf(true)
    .set("spark.cassandra.connection.host", "192.168.123.10")
    .set("spark.cassandra.auth.username", "cassandra")            
    .set("spark.cassandra.auth.password", "cassandra")
    .set("spark.cassandra.output.batch.size.rows", "100")            
    .set("spark.cassandra.output.concurrent.writes", "100")
    .set("spark.cassandra.output.batch.size.bytes", "100")            
    .set("spark.cassandra.output.batch.grouping.key", "partition")

val sc = new SparkContext("spark://192.168.123.10:7077", "test", conf)

您可以参考此自述文件以了解更多信息。

Answer 2

最灵活的方法是将这些变量添加到文件中，例如spark.conf ：

spark.cassandra.output.concurrent.writes 10

等等...，然后在您的应用中使用以下内容创建spark上下文：

val conf = new SparkConf()
val sc = new SparkContext(conf)

最后，当您提交应用程序时，可以使用以下命令指定属性文件：

spark-submit --properties-file spark.conf ...

创建Spark上下文时，Spark会自动从spark.conf中读取您的配置。这样，您可以修改spark.conf上的属性，而无需每次都重新编译代码。

火花卡桑德拉调音

问题描述

2 个解决方案

解决方案1
2 已采纳 2018-03-06 16:52:33

解决方案2
0 2018-03-07 23:43:56

火花卡桑德拉调音

问题描述

2 个解决方案

解决方案1 2 已采纳 2018-03-06 16:52:33

解决方案2 0 2018-03-07 23:43:56

解决方案1
2 已采纳 2018-03-06 16:52:33

解决方案2
0 2018-03-07 23:43:56