簡體   English   中英

hadoop獸人表一直只使用一個映射器

[英]hadoop orc table taking only one mapper all the time

在我當前的項目中,我正在使用具有快速壓縮格式的Orc文件,無論運行什么查詢,它都僅使用一個mapper運行。我試圖配置mapred.max.split.size和mapred.min.split.size,但是並沒有顯示映射器數量的任何變化。reduce數量足夠好,但是由於映射器是單個映射器,因此可以運行一個簡單的查詢,例如。

從x的z組中選擇x,max(y); 完成映射器大約需要20分鍾。 還有其他我應該做的事情來增加映射器的數量。

請不要告訴我要使用分區或存儲桶,因為我已經在表中使用了它們。

嘗試使用tblproperties orc.stripe.size。

條帶大小的默認值為256 MB,從技術上講,每條帶有一個映射器。 隨着單個條帶大小的減少,您可以增加映射器的數量。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM