简体繁体 English

在Spark中执行mapreduces

[英]Execute mapreduces in Spark

原文 2018-03-17 11:54:57 2 1 hadoop/ apache-spark/ mapreduce

My teacher said that we can execute MapReduces in Spark. 我的老师说我们可以在Spark中执行MapReduces。 But, since Spark is said to be faster that hadoop, this means that is always better to do mapreduces in spark. 但是，由于据说Spark比hadoop更快，这意味着在spark中进行mapreduce总是更好。 So, Hadoop MapReduces become useless. 因此，Hadoop MapReduces变得毫无用处。 Is this correct ? 这个对吗？

1 个解决方案

You can execute map() and reduce() function operations on Spark RDD and DataFrames. 您可以在Spark RDD和DataFrames上执行map()和reduce() 函数操作 。

I think this is what your teacher meant 我想这就是你老师的意思

Also Spark is not faster than Hadoop - it's complimentary to Hadoop, it might be faster than Mapreduce, but given the proper resource allocation, Tez execution can actually be faster than Spark and MapReduce and require less total resources than Spark. 同样，Spark并不比Hadoop快-它是对Hadoop的补充，它可能比Mapreduce快，但是考虑到正确的资源分配，Tez的执行实际上可以比Spark和MapReduce快，并且所需的总资源比Spark少。 Unfortunately, one doesn't just write Tez code in most cases, it's usually actions in Pig or Hive 不幸的是，在大多数情况下，不仅会编写Tez代码，而且通常是Pig或Hive中的操作

Spark Scala 如何执行 - Spark Scala how to execute

Spark：基于Hadoop多节点用Spark执行python脚本 - Spark : Execute python script with Spark based on Hadoop Multinode

YARN上的Spark：没有worker的执行驱动程序 - Spark on YARN: execute driver without worker

如何强制 Spark 执行代码？ - How can I force Spark to execute code?

Spark：静默执行sc.wholeTextFiles - Spark: Silently execute sc.wholeTextFiles

如何使用动态资源分配执行 Spark 程序？ - How to execute Spark programs with Dynamic Resource Allocation?

尝试从UDF执行Spark SQL查询 - Trying to execute a spark sql query from a UDF

如何在spark中使用transform python udf执行hql脚本？ - How to execute hql script with transform python udf in spark?

Spark无法再执行作业。执行程序无法创建目录 - Spark can no longer execute jobs. Executors fail to create directory

Spark：sc.WholeTextFiles需要很长时间才能执行 - Spark: sc.WholeTextFiles takes a long time to execute

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Spark Scala 如何执行 - Spark Scala how to execute Spark：基于Hadoop多节点用Spark执行python脚本 - Spark : Execute python script with Spark based on Hadoop Multinode YARN上的Spark：没有worker的执行驱动程序 - Spark on YARN: execute driver without worker 如何强制 Spark 执行代码？ - How can I force Spark to execute code? Spark：静默执行sc.wholeTextFiles - Spark: Silently execute sc.wholeTextFiles 如何使用动态资源分配执行 Spark 程序？ - How to execute Spark programs with Dynamic Resource Allocation? 尝试从UDF执行Spark SQL查询 - Trying to execute a spark sql query from a UDF 如何在spark中使用transform python udf执行hql脚本？ - How to execute hql script with transform python udf in spark? Spark无法再执行作业。执行程序无法创建目录 - Spark can no longer execute jobs. Executors fail to create directory Spark：sc.WholeTextFiles需要很长时间才能执行 - Spark: sc.WholeTextFiles takes a long time to execute

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM