繁体 English 中英

多个mysql表中的数据到hadoop map-reduce

[英]data from mutiple mysql tables to hadoop map-reduce

原文 2012-03-02 12:31:54 7 2 java/ mysql/ hadoop/ mapreduce

我们有以下情形：

我们有一系列用Java实现的map-reduce processes 。当前我们正在从mysql表读取数据并将输出保存到另一个mysql table 。现在我们可能需要来自另一个表的数据作为map / reduce进程的输入。

可能的解决方案：

a）我们可以有一个联接查询以输入到映射过程，或者

b）我们可以通过建立简单的jdbc connection并一次又一次地请求数据来读取所需的数据（尽管我不喜欢它）。

问题：

在这种情况下的最佳做法是什么？ 我们mongoDB可能会迁移到mongoDB 。在这种情况下，最佳做法是什么？

2 个解决方案

我认为目前不可能。

可以使用SQOOP和HIVE 。

您可以使用SQOOP将数据从mysql表传输到HDFS，然后传输到HIVE 。 从HIVE（操作后），您可以将表导出回Mysql。

范例：

首先下载mysql-connector-java-5.0.8并将jar放到Sqoop的lib和bin文件夹中
在Hive中创建表定义，并使用与mysql中相同的字段名称和类型

sqoop import --verbose --fields-terminate-by'，'--connect jdbc：mysql：// localhost / test --table employee --hive-import --warehouse-dir / user / hive / warehouse --fields -以'，'结尾-以id为分隔-hive-table员工

请点击此链接以供参考

在Hadoop map-reduce中对联接的数据进行分组

[英]Grouping joined data in Hadoop map-reduce

结合hadoop map-reduce的结果

[英]Combining results from hadoop map-reduce

Hadoop Map-Reduce。记录阅读器

[英]Hadoop Map-Reduce . RecordReader

Hadoop map-reduce 编程

[英]Hadoop map-reduce programming

运行本地hadoop map-reduce不会按预期对数据进行分区

[英]Running a local hadoop map-reduce does not partition data as expected

即时将输入数据添加到Hadoop Map-Reduce Job？

[英]Add input data on the fly to Hadoop Map-Reduce Job?

运行Hadoop Map-Reduce作业

[英]Running a Hadoop Map-Reduce Job

对Hadoop Map-Reduce应用程序进行基准测试

[英]Benchmarking Hadoop Map-Reduce application

Hadoop Map-Reduce输出文件异常

[英]Hadoop Map-Reduce Output File Exception

为什么Hadoop Map-Reduce应用程序在两个不同的reduce任务中处理相同的数据？

[英]Why is Hadoop Map-Reduce application processing the same data in two different reduce tasks?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Hadoop map-reduce中对联接的数据进行分组结合hadoop map-reduce的结果 Hadoop Map-Reduce。记录阅读器 Hadoop map-reduce 编程运行本地hadoop map-reduce不会按预期对数据进行分区即时将输入数据添加到Hadoop Map-Reduce Job？运行Hadoop Map-Reduce作业对Hadoop Map-Reduce应用程序进行基准测试 Hadoop Map-Reduce输出文件异常为什么Hadoop Map-Reduce应用程序在两个不同的reduce任务中处理相同的数据？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM