繁体 English 中英

我可以使用 memoization 来缓存来自 spark 作业的 hbase 读写数据吗？

[英]Can I use memoization to cache data in the hbase read and write from spark job?

原文 2019-09-28 02:37:51 7 1 scala/ hbase/ spark-streaming/ user-defined-functions/ memoization

在具有 Spark 作业的 Scala 项目中，我使用 Spark-Hbase 连接器 (SHC) 连接从 Hbase 数据读取。 请求的数量非常大，我正在尝试使用缓存的数据一段时间。 我想知道我是否可以这样做。 也许记忆可以帮助？！

1 个解决方案

HBase 本身提供了两种不同的缓存。

将数据缓存到 Spark 的一种方法是使用Pair RDD 。

您还可以使用广播变量

关于 memoization，请记住它是单个节点的本地化。 因此，您可以在一个节点上存储数据并在所有其他节点上缓存未命中。

如何从Spark中的Hbase表读取数据？

[英]How can i read data from Hbase table in Spark?

如何使用 Spark 从 Azurite 读取/写入数据？

[英]How can I read/write data from Azurite using Spark?

如何在Apache Spark中缓存可被其他Spark作业使用的数据

[英]how to cache data in apache spark that can be used by other spark job

无法从Spark Scala Dataframe向Hbase写入数据

[英]Unable to write data to Hbase from Spark Scala Dataframe

使用 spark 从 hbase 读取特定列数据

[英]using spark to read specific columns data from hbase

Spark rdd写信给Hbase

[英]Spark rdd write to Hbase

Spark Hbase连接器（SHC）不从HBase表返回任何数据

[英]Spark Hbase connector (SHC) is not returning any data from HBase table

如何使用JDBC源在(Py)Spark中读写数据？

[英]How to use JDBC source to write and read data in (Py)Spark?

如何使用Spark流使用Scala从HBASE表获取数据

[英]How to use spark streaming to get data from HBASE table using scala

无法使用 spark scala 读取和写入 kafka 主题

[英]Can't Read from and write to kafka topic using spark scala

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何从Spark中的Hbase表读取数据？如何使用 Spark 从 Azurite 读取/写入数据？如何在Apache Spark中缓存可被其他Spark作业使用的数据无法从Spark Scala Dataframe向Hbase写入数据使用 spark 从 hbase 读取特定列数据 Spark rdd写信给Hbase Spark Hbase连接器（SHC）不从HBase表返回任何数据如何使用JDBC源在(Py)Spark中读写数据？如何使用Spark流使用Scala从HBASE表获取数据无法使用 spark scala 读取和写入 kafka 主题

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM