使用 Spark 从大型 Cassandra 表读取错误，获取“远程 RPC 客户端已解除关联”

Question

I set stand alone spark cluster (with cassandra) and i did it but when i read data i get error.My cluster has 3 nodes and each node has 64 GB ram and 20 cores.我设置了独立的 spark 集群（使用 cassandra）并且我做到了，但是当我读取数据时出现错误。我的集群有 3 个节点，每个节点有 64 GB 内存和 20 个内核。 I'm sharing some Spark-env.sh configuration like spark_executor_cores: 5, spark_executor_memory:5G, spark_worker_cores:20 and spark_worker_memory:45g.我正在分享一些 Spark-env.sh 配置，例如 spark_executor_cores: 5、spark_executor_memory:5G、spark_worker_cores:20 和 spark_worker_memory:45g。

I want to give another information, when i read small table there is no problem but when i read big table i get error.我想提供另一个信息，当我读取小表时没有问题，但是当我读取大表时出现错误。 Error description at below.错误描述如下。 Also when i start pyspark i use this command:此外，当我启动 pyspark 时，我使用以下命令：

$ ./pyspark --master spark://10.0.0.100:7077
    --packages com.datastax.spark:spark-cassandra-connector_2.12:3.1.0
    --conf spark.driver.extraJavaOptions=-Xss1024m
    --conf spark.driver.port:36605
    --conf spark.driver.blockManager.port=42365

Thanks for your interest感谢您的关注

ERROR TaskSchedulerImpl: Lost executor 5 on 10.0.0.10: Remote RPC client disassociated. likely due to containers exceeding threshold, or network issues. Chec driver logs for WARN messages
WARN TaskSetManager: Lost task 0.0 in stage 0.0 (TID 0) (10.0.0.10 executor 5): ExecutorLostFailure (executor 5 exited caused by one of the runnning task) reason: remote RPC client disassociated.
WARN TaskSetManager: Lost task 0.1 in stage 0.0 (TID 1) (10.0.0.11 executor 2):Java.lang.StackOverflowError
 at java.base/java.nio.ByteBuffer.position(ByteBuffer.java:1094)
 at java.base/java.nio.HeapByteBuffer.get(HeapByteBuffer.java:184)
 at org.apache.spark.util.ByteBufferInputStream.read(ObjectInputStream.scala:49)
 at java.base/java.io.ObjectInputStream$PeekInputStream.read(ObjectInputStream.java:2887)
 at java.base/java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2903)
 at java.base/java.io.ObjectInputStream$BlockDataInputStream.readUTFBody(ObjectInputStream.java:3678) 
 at java.base/java.io.ObjectInputStream$BlockDataInputStream.readUTF(ObjectInputStream.java:3678)
at java.base/java.io.ObjectInputStream.readString(ObjectInputStream.java:2058)
at java.base/java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1663)
at java.base/java.io.ObjectInputStream.defaultReadFields(ObjectInputStream.java:2490)
at java.base/java.io.ObjectInputStream.readSerialData(ObjectInputStream.java:2384)
at java.base/java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2222)
at java.base/java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1681)
at java.base/java.io.ObjectInputStream.defaultReadFields(ObjectInputStream.java:2490)
at java.base/java.io.ObjectInputStream.readSerialData(ObjectInputStream.java:2384)
at java.base/java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2222)
at java.base/java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1681)
at java.base/java.io.ObjectInputStream.defaultReadFields(ObjectInputStream.java:2490)
at java.base/java.io.ObjectInputStream.readSerialData(ObjectInputStream.java:2384)
at java.base/java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2222)
at java.base/java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1681)
at java.base/java.io.ObjectInputStream.defaultReadFields(ObjectInputStream.java:2490)
at java.base/java.io.ObjectInputStream.readSerialData(ObjectInputStream.java:2384)
at java.base/java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2222)

Answer 1

The problem you're running into is most likely a networking issue.您遇到的问题很可能是网络问题。

It's highly unusual that you need to pin the driver ports with:您需要使用以下方式固定驱动程序端口是非常不寻常的：

    --conf spark.driver.port:36605
    --conf spark.driver.blockManager.port=42365

You'll need to provide background information on why you're doing this.您需要提供有关您为什么这样做的背景信息。

Also as I previously advised you on another question last week, you need to provide the minimal code + minimal configuration that replicates the problem.同样，正如我上周在另一个问题上建议您的那样，您需要提供复制问题的最少代码 + 最少配置。 Otherwise, there isn't enough information for others to be able to help you.否则，没有足够的信息让其他人能够帮助您。 Cheers!干杯!

使用 Spark 从大型 Cassandra 表读取错误，获取“远程 RPC 客户端已解除关联”

问题描述

1 个解决方案

解决方案1
0 2022-09-05 23:13:22

使用 Spark 从大型 Cassandra 表读取错误，获取“远程 RPC 客户端已解除关联”

问题描述

1 个解决方案

解决方案1 0 2022-09-05 23:13:22

解决方案1
0 2022-09-05 23:13:22