我将每天运行多个spark作业,并且我需要在作业完成后动态地将每个spark作业的结果存储在hive表中。

例如,假设火花作业的结果如下所示

job1: a,344

job2: b,456

job3: c,6789

我需要在下面的hive表中得到结果

蜂巢表:spark_results

spark_results.id   spark_results.value

    a                  344
    b                  456
    c                  6789

有没有办法做到这一点?

  ask by yAsH translate from so

本文未有回复,本站智能推荐: