![](/img/trans.png)
[英]Hive with Hadoop vs Hive with spark vs spark sql vs HDFS - How do they all work with each other?
[英]Spark SQL vs HIVE on Spark
Spark上的Spark-SQL和Hive之間的區別。 我正在瀏覽spark和sql的文檔,並試圖了解Spark上的Spark-SQL和HIVE之間的區別。
hive-site.xml
,然后在我的spark程序中hive-site.xml
一個表,數據和元數據將存儲在哪里。 將火花創造一個新的Hive Metastore(如德比)? hive-ste.xml
並讓spark知道現有的hive。 然后,如果我堅持表格,數據和元數據將存儲在HDFS的現有Hive Metastore和Data in Warehouse目錄中。 謝謝。
當您啟動spark會話時,數據可以存儲在S3或HDFS中。如果沒有明確創建,則不會固有地創建Hive會話。
如果您使用引用Hive表的'saveastable'子句,則為Yes。 數據將保留在HDFS中。 請記住,如果刪除EMFS中的HDFS實例,表格將隨其數據一起被刪除。
對問題#3不確定
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.