繁体   English   中英

HBase设计扫描表

[英]Hbase design to scan table

我有数据格式

timestame(long),useid(long),value(String)

我想将数据放入Hbase。并且我必须每天扫描此表。所以我打算将rowkey设置为timestame。 如果要在日期1和日期2中进行扫描,我将扫描行键r>日期1和行键r <date2。

但是rowkey稳定增加(例如:1352029502000、1352029502001、1352029502003 ...),插入速度很慢。

在这种情况下,最佳的hbase表架构是什么?

谢谢。

处理时间戳或其他单调增加的密钥时,避免热点的常见方法是在其之前添加一些前缀(例如,参见OpenTSDB schema

您还可以添加任意键(例如时间戳中的最后一位)并获得任意分区(示例中为10)。

但是请注意,添加前缀时,您必须扫描所有前缀,以使读取变得更加复杂(但实际上map-reduce也会更好地工作)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM