繁体 English 中英

ETL过程，使用Apache Spark将数据从一个Db传输到另一个Db

[英]ETL process to transfer data from one Db to another using Apache Spark

原文 2017-08-16 05:58:26 1 1 java/ amazon-web-services/ hadoop/ apache-spark/ amazon-ec2

我需要创建一个ETL流程，每天将其从多个SQLServer实例中提取，转换并加载100多个表，然后并行加载到多个Oracle实例中。 我了解可以在Java中创建多个线程来完成此操作，但是如果所有线程都在同一台计算机上运行，则此方法将无法扩展。 另一种方法是获取一堆ec2实例，并开始在不同的ec2实例上为每个实例传输表。 但是，使用这种方法，我将不得不通过从池中添加/删除计算机来照顾“弹性”。

我以某种方式可以使用“ Amazon EMR上的Apache Spark”来完成此操作，但是过去我仅使用Spark处理HDFS / Hive上的数据，因此不确定将数据从一个Db传输到另一个Db是否很好。 Spark的用例-或-是吗？

1 个解决方案

从最后一个问题开始： “不确定将数据从一个Db传输到另一个Db是否是Spark的一个好用例” ：

在JDBC spark连接器的限制内。 存在一些限制，例如缺少更新支持以及读取表时的并行性（要求通过数字列拆分表）。

考虑到IO成本和RDBMS的整体性能，在FIFO模式下运行作业听起来不是一个好主意。 您可以使用需要1/x群集资源的配置来提交每个作业，因此将并行处理x表。

将表从一个 DB (HANA) 传输到另一个 DB (MySQL

[英]Transfer tables from one DB (HANA) to another DB (MySQL

从一项服务到另一项服务的大数据传输

[英]Large Data transfer from one Service to another

使用AS2传输协议将文件从一台计算机传输到另一台计算机

[英]Transfer file from one machine to another using AS2 transfer protocol

如何在Java中处理来自Apache Spark Streaming的Json数据

[英]How to process Json data from Apache spark Streaming in java

如何使用angular js和Java servlet将数据从一页传输到另一页

[英]How to transfer data from one page to another using angular js and Java servlets

使用静态类或此引用（Eclipse）将数据从一个Jframe传输到另一个Jframe？

[英]Transfer data from one Jframe to another jframe using static class or this reference(Eclipse)?

我们可以使用SharedPreference将数据从一个活动共享或传输到另一个活动吗？

[英]Can we share or transfer data from one Activity to another Activity using SharedPreference?

如何在不使用表单和输入标签的情况下将数据从一个 html 页面传输到另一个页面

[英]how to transfer data from one html page to another without using forms and input tags

使用 static class 或此参考将数据从一个 Jframe 传输到另一个 jframe？

[英]Transfer data from one Jframe to another jframe using static class or this reference?

Apache Spark可以加快从Oracle DB读取数百万条记录并将它们写入文件的过程吗？

[英]Can Apache Spark speed up the process of reading millions of records from Oracle DB and then writing these to a file?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 将表从一个 DB (HANA) 传输到另一个 DB (MySQL 从一项服务到另一项服务的大数据传输使用AS2传输协议将文件从一台计算机传输到另一台计算机如何在Java中处理来自Apache Spark Streaming的Json数据如何使用angular js和Java servlet将数据从一页传输到另一页使用静态类或此引用（Eclipse）将数据从一个Jframe传输到另一个Jframe？我们可以使用SharedPreference将数据从一个活动共享或传输到另一个活动吗？如何在不使用表单和输入标签的情况下将数据从一个 html 页面传输到另一个页面使用 static class 或此参考将数据从一个 Jframe 传输到另一个 jframe？ Apache Spark可以加快从Oracle DB读取数百万条记录并将它们写入文件的过程吗？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM