[英]How is running a script using aws emr script-runner different from running it from bash?
我在aws emr上使用了脚本运行程序,并且考虑到它看起来非常基本(甚至可能是stuid)问题,但是我阅读了许多文档,没有人回答为什么在emr中我们需要一个脚本运行程序,而它所做的只是执行一个脚本在主节点上。 不能使用bash运行相同的脚本吗?
当您只想执行脚本但入口点需要jar时,则需要脚本运行器。 例如,提交EMR步骤将执行“ hadoop jar blah ...”命令。 但是,如果“ blah”是脚本,则此操作将失败。 脚本运行器成为Step期望的jar,然后使用其参数(脚本路径)执行Shell脚本。
在bash中运行脚本时,需要将脚本本地放置,还需要设置所有配置以使其按预期工作。
使用脚本运行器,您可以有更多选择,例如,将其作为群集启动命令的一部分运行,以及执行在S3中远程托管的脚本。 请参阅EMR文档中的示例: http : //docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-hadoop-script.html
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.