簡體   English   中英

字符串vs Varchar Hive查詢性能

[英]String vs Varchar Hive Query Performance

我的這張表有5條軋機記錄,大約25列,其中大多數是String類型的。 當我進行查詢時,它將持續約47秒以獲取結果。 每個String列都有2 GB的空間(因為我不知道如何減少該值) ,一列的最大長度記錄約為32k個字符,其他列的最大長度要少得多(7,18, 50)。

為了獲得更好的查詢性能, 我復制了該表,但是在所有STring列中,我對上面提到的長記錄使用了Varchar(1000)和varchar(50000)代替String 我以為這樣可以使我更快地獲取數據,但是幾乎要花兩倍的時間。

據我了解,即時通訊使用的方式使用varchar的空間更少,但是以某種方式卻沒有發生。 在相同條件下,我應該使用varchar而不是string獲得更好的響應嗎?

stringvarchar之間應該沒有任何性能差異,但最好的選擇是用作字符串, varchar也作為字符串內部存儲。

這是有關兩者的詳細比較的一些出色的線索:

https://community.hortonworks.com/questions/48260/hive-string-vs-varchar-performance.html

Hive-Varchar vs String,如果存儲格式為Parquet文件格式,是否有任何優勢

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM