[英]String vs Varchar Hive Query Performance
我的這張表有5條軋機記錄,大約25列,其中大多數是String類型的。 當我進行查詢時,它將持續約47秒以獲取結果。 每個String列都有2 GB的空間(因為我不知道如何減少該值) ,一列的最大長度記錄約為32k個字符,其他列的最大長度要少得多(7,18, 50)。
為了獲得更好的查詢性能, 我復制了該表,但是在所有STring列中,我對上面提到的長記錄使用了Varchar(1000)和varchar(50000)來代替String 。 我以為這樣可以使我更快地獲取數據,但是幾乎要花兩倍的時間。
據我了解,即時通訊使用的方式使用varchar的空間更少,但是以某種方式卻沒有發生。 在相同條件下,我應該使用varchar而不是string獲得更好的響應嗎?
string
和varchar
之間應該沒有任何性能差異,但最好的選擇是用作字符串, varchar
也作為字符串內部存儲。
這是有關兩者的詳細比較的一些出色的線索:
https://community.hortonworks.com/questions/48260/hive-string-vs-varchar-performance.html
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.