簡體   English   中英

BigData環境中在哪里創建登台數據表?

[英]Where to create staging data table in BigData environment?

我目前正在使用Hadoop-2,PIG,HIVE和HBASE。 我有一個輸入數據。 我已經將該數據加載到HDFS中。 我想在此環境中創建暫存數據。

我的查詢是-

我應該在哪個BigData組件中創建登台表(Pig / HIVE / HBASE); 這將根據條件輸入數據嗎? 稍后,我們可能要運行帶有復雜邏輯的MapReduce作業。

請協助

任何你想的地點都可以。 Pig沒有選項,因為它沒有Metastore。 如果需要SQL Like查詢,請配置。 HBase基於您的訪問模式。

當您在數據之上運行Hive查詢時,它將轉換為MR。

在Hive中創建它時,請使用Hive查詢而不是MR。 如果您正在使用MR,請使用Pig。 在數據之上創建Hive表將無濟於事。

Hive:如果您有OLAP類型的工作量,並且不需要實時讀取/寫入。

HBase:如果您有OLTP類的工作負載。 您需要進行實時/流式讀/寫。 使用MapReduce可以完成一些批處理或OLAP處理。 使用Apache Phoenix可以進行類似SQL的查詢。

您可以在HIVE和HBase上同時運行MapReduce作業。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM