Hbase中的超前和滞后

Question

我正在尝试找出如何在Hbase中执行与Oracle的LEAD和LAG等效的方法或其他可以解决我的问题的模式。 我可以编写一个很容易做到这一点的MapReduce程序，但是我很想能够利用这样的事实，即数据已经按照我需要的方式进行了排序。

我的问题如下：我有一个行键和一个值，看起来像：

(employee name + timestamp) => data:salary

因此，一些示例数据可能是：

miller, bob;2010-01-14 => data:salary=90000
miller, bob;2010-11-04 => data:salary=102000
miller, bob;2011-12-03 => data:salary=107000
monty, fred;2010-04-10 => data:salary=19000
monty, fred;2011-09-09 => data:salary=24000

我要做的是逐条记录计算工资的变化。 我想将上述数据转换为记录之间的差异：

miller, bob;2010-01-14 => data:salarydiff=90000
miller, bob;2010-11-04 => data:salarydiff=12000
miller, bob;2011-12-03 => data:salarydiff=5000
monty, fred;2010-04-10 => data:salarydiff=19000
monty, fred;2011-09-09 => data:salarydiff=5000

如果需要，我打算更改行键策略。

Answer 1

我要做的是更改密钥，以使时间戳记递减（新工资先发）

miller, bob;2011-12-03 => data:salary=107000
miller, bob;2010-11-04 => data:salary=102000
miller, bob;2010-01-14 => data:salary=90000

现在，您可以做一个简单的地图工作，它将扫描表格。 然后在地图中创建一个新的“扫描到当前键”。 Scan.next获取以前的薪水，计算差异并将其存储在当前行键的新列中
基本上在您的mapper类（继承TableMapper的类）中，您将覆盖setup方法并获取配置

@Override
protected void setup(Mapper.Context context) throws IOException,InterruptedException {
    Configuration config = context.getConfiguration();
    table = new HTable(config,<Table Name>);
}

然后在地图内部，从行参数中提取行键，创建新的“扫描”并按照上述说明继续

在大多数情况下，下一条记录将在同一地区-有时可能会转到其他地区服务器

Hbase中的超前和滞后

问题描述

1 个解决方案

解决方案1
1 已采纳 2011-12-08 23:02:55

Hbase中的超前和滞后

问题描述

1 个解决方案

解决方案1 1 已采纳 2011-12-08 23:02:55

解决方案1
1 已采纳 2011-12-08 23:02:55