簡體   English   中英

Apache Spark / Scala批量插入/更新到HBASE

[英]Apache Spark/Scala Bulk inset/update to HBASE

以下是我的情況:

  1. 最初使用Sqoop將數據加載到HBASE (已完成)
  2. 現在,我將每天獲得一批數據(大約600000條記錄),這些數據是新數據(用於將新記錄插入到HBASE中)和舊數據(用於更新HBASE的現有記錄)的組合。 現在我的問題是:

如何使用Spark / scalaHbase表執行此操作。

非常感謝您的早日答復。

謝謝蘇維克

我建議您閱讀該問題的答案以獲取概述。

我的回答中,我提到了幾個可以使用的選項:

由於您使用的是Spark 1.6.1,因此可以使用其中任何一個。 在HBase的火花DataFrames工作的例子可以發現在這里 ,而火花上的HBase類似的例子可以發現在這里

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM