簡體   English   中英

使用Hive在HDFS中插入數據

[英]insert data in HDFS using Hive

假設我們有一個外部Hive表,該表指向hdfs目錄中的CSV文件。

所以使用hive在此表上插入新行時發生了什么:

  1. 插入會導致整個表被重寫嗎?
  2. 還是整個重寫數據所在的hdfs塊?
  3. 還是僅將新行添加到文件末尾?

有關更新操作的相同問題

提前致謝 !

回答您的問題,以為您使用的是插入語句,而不是對文件使用INSERT OVERWRITE

  1. 否,插入將使用您插入的數據創建一個新文件
  2. 否,只會插入新文件
  3. 沒有對現有文件進行追加

即使您使用INSERT INTO並插入一些文件,這些新文件也會出現並位於HDFS的特定目錄中,而不會影響現有文件。

如果使用INSERT OVERWRITE ,則將刪除給定表目錄中存在的所有文件,並將新文件放置在該目錄中。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM