[英]Hbase design to scan table
我有数据格式
timestame(long),useid(long),value(String)
我想将数据放入Hbase。并且我必须每天扫描此表。所以我打算将rowkey设置为timestame。 如果要在日期1和日期2中进行扫描,我将扫描行键r>日期1和行键r <date2。
但是rowkey稳定增加(例如:1352029502000、1352029502001、1352029502003 ...),插入速度很慢。
在这种情况下,最佳的hbase表架构是什么?
谢谢。
处理时间戳或其他单调增加的密钥时,避免热点的常见方法是在其之前添加一些前缀(例如,参见OpenTSDB schema 。
您还可以添加任意键(例如时间戳中的最后一位)并获得任意分区(示例中为10)。
但是请注意,添加前缀时,您必须扫描所有前缀,以使读取变得更加复杂(但实际上map-reduce也会更好地工作)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.