Spark 和 Cassandra：要求失败：在 com.datastax.spark.connector.japi.CassandraRow 类中找不到列：[mycolumn...]

Question

I have a CassandraRow object that contains values of a row.我有一个包含行值的 CassandraRow 对象。 I read it from a one table.我从一张桌子上读到它。 I want to write that same object to another table.我想将同一个对象写入另一个表。 But then I get this error:但是后来我收到了这个错误：

requirement failed: Columns not found in class com.datastax.spark.connector.japi.CassandraRow: [myColumn1, myColumns2, ...]要求失败：在 com.datastax.spark.connector.japi.CassandraRow 类中找不到列：[myColumn1, myColumns2, ...]

I tried to pass my own mapping by creating a Map and passing it in the function.我试图通过创建一个 Map 并将其传递到函数中来传递我自己的映射。 This is my code:这是我的代码：

CassandraRow row = fetch();

Map<String, String> mapping = Map.of("myColumn1", "myColumn1", "myColumns2", "myColumns2"....);

JavaSparkContext ctx = new JavaSparkContext(conf);

JavaRDD<CassandraRow> insightRDD = ctx.parallelize(List.of(row));

CassandraJavaUtil.javaFunctions(insightRDD).writerBuilder("mykeyspace", "mytable",
            CassandraJavaUtil.mapToRow(CassandraRow.class, mapping)).saveToCassandra(); //I also tried without mapping

Any help is appreciated.任何帮助表示赞赏。 I have tried POJO approach and it is working.我已经尝试过 POJO 方法并且它正在工作。 But I don't want to be restricted to creating POJOs.但我不想局限于创建 POJO。 I want a generic approach that would work with any table and any row.我想要一种适用于任何表和任何行的通用方法。

Answer 1

I could not find a way to generalize my solution using Apache Spark.我找不到使用 Apache Spark 概括我的解决方案的方法。 So I use Datastax Java Driver for Apache Cassandra and wrote SQL queries.所以我使用 Datastax Java Driver for Apache Cassandra 并编写了 SQL 查询。 That was generic enough for me.这对我来说已经足够通用了。

Spark 和 Cassandra：要求失败：在 com.datastax.spark.connector.japi.CassandraRow 类中找不到列：[mycolumn...]

问题描述

1 个解决方案

解决方案1
0 已采纳 2020-03-08 05:25:27

Spark 和 Cassandra：要求失败：在 com.datastax.spark.connector.japi.CassandraRow 类中找不到列：[mycolumn...]

问题描述

1 个解决方案

解决方案1 0 已采纳 2020-03-08 05:25:27

解决方案1
0 已采纳 2020-03-08 05:25:27