cost 95 ms
无法运行(计划)oozie 示例 map 减少工作 || java.net.ConnectException - Not able to run(schedule) oozie example map reduce job || java.net.ConnectException

我正在使用 Hadoop 2.6.0 和 oozie 5.2.0 版本。 尝试运行示例 Map 减少 oozie 中的作业但低于错误。 error screenshot不确定我是否必须更改任何配置。 我尝试在 job.properties 文件而不是 localhost 中提供 public d ...

oozie 初始实例和开始时间在缺少数据集时给出错误 - oozie intial instance and start time giving error on missing dataset

我是 oozie 的新手,并试图了解 dataset.xml。 我有以下数据集并试图了解 oozie 究竟想在这里验证什么。 初始实例的含义是什么以及uri-template在这里做了什么(在oozie文档上不清楚) 同样,在协调器中,我有以下输入和输出数据集。 这里 current(-5) 和 ...

Oozie 协调器获取星期几 - Oozie coordinator get day of the week

我试图在我的 Oozie 工作流中创建一个条件,其中应仅在星期一(在工作流结束时)执行操作。 到目前为止,我在工作流中添加了一个决策节点,并将当前日期作为协调器中的参数,我需要测试星期几。 协调员.xml workflow.xml 我没有找到有关如何使用 EL 函数获取星期几的信息。 任何帮助表示 ...

使用特殊库在 OOzie 中运行 Python 脚本而不将它们安装到服务器 - Running Python Script in OOzie with special libraries without install them to server

我想在带有特殊库的 OOzie 工作流中运行 Python 脚本。 但是,我想在不将这些特殊库安装到 Hadoop 个节点的情况下运行此脚本。 我尝试使用 virtualenv 运行但失败了。 有谁知道如何在不在服务器端安装任何库的情况下运行这个 Python 脚本? 谢谢:) ...

在 oozei 中与 spark java.lang.IllegalArgumentException: java.net.UnknownHostException: nameservice1 - in oozei with spark java.lang.IllegalArgumentException: java.net.UnknownHostException: nameservice1

我使用 CDH 6.3.2 hadoop 是医管局我制作了一个带有色调火花的工作流程运行这个工作流程我得到一个错误 在我的 hdfs-site.xml 我可以在 hue 中使用 hive 运行工作流我可以运行 spark-shell --jars hdfs://nameservice1/spar ...

Oozie 变量无法解析 - Oozie variable cannot be resolved

在决策节点中传递变量时遇到问题。 该参数在全局配置下声明 但是当在Decision节点下使用“currentDate”时,它无法解析。 我收到的错误错误代码:EL_ERROR 错误消息:变量 [currentDate] 无法解析我的第一个 oozie worflow.. 可能犯了愚蠢的错误。 请帮帮 ...

Oozie 让其他分叉操作继续,以防一个失败但在加入后终止 - Oozie let other forked actions continue in case one fails but terminate after the join

我有一个工作流程,分为 3 个动作。 三个路径启动一系列操作,每个操作都可能失败。 我觉得微不足道的事情是创建以下 DAG。 join后,其他动作随之而来。 下面 DAG 的问题是,如果我到达一个kill节点,例如在顶部路径,所有其他路径也将在到达join之前被杀死。 但是,这不是所需的流程。 ...

在 Oozie 工作流中运行的 Hive 查询中使用用户名创建表名? - Create table name using username in Hive query running in Oozie workflow?

作为 Oozie 工作流程的一部分,我有一个 Hive SQL 脚本/动作。 我正在做一个 CREATE TABLE AS SELECT 到 output 结果。 我想使用用户名加上附加的字符串(例如“User123456_output_table”)来命名表,但似乎无法获得正确的语法。 这不起作 ...

oozie 工作流抛出 Socket 错误,但在 10 分钟后提交了两次工作流 - oozie workflow throws Socket error but submits the workflow twice after 10 minutes

我面临着非常奇怪的问题。 我有工作流 xml,其中包含 20 个 fork-join 节点,每个节点包含 4-8 个 actions 。 当我提交此工作流程时,它等待 5-6 分钟,抛出 但实际上在后台发生的是它在 10 分钟后提交一个工作流,12 分钟后提交另一个工作流。 所以它最终会触发它两 ...

Oozie Spark 操作工作流无法启动 - Oozie Spark action workflow can not start

我有一个不能通过 Oozie 运行的简单火花作业。 相同的火花作业通过火花提交运行。 我提交作业工作流并收到以下错误: 这是job.properties: 这是工作流 XML: 同一个集群可以毫无问题地运行其他操作和工作流。 一旦 spark 操作成为工作流的一部分,此错误就会导致启动器 ...

当纱线报告 oozie 启动器和 mapreduce 作业已成功完成时,为什么 Oozie 会因错误代码 LimitExceededException 而失败? - Why would Oozie fail a job with Error Code LimitExceededException when yarn reports that oozie launcher & mapreduce job have completed successfully?

SO上有一些与此类似的问题。 然而,没有什么对我有用。 所以我发布了这个问题。 我正在使用 CDH 6.2.1 我有一个具有 map-reduce 操作的工作流。 map-reduce 作业会创建很多计数器(我认为 m/r 作业会产生约 300 个计数器)。 我已将 cdh/yarn/conf ...

如何在 oozie 中为多个工作流指向集中位置 - How to point centralized location for multiple workflows in oozie

我有超过 10 个 oozie 工作流程。 每个 workflow.xml、coordinator.properties 和 xml 加上 lib 文件夹都在一个单独的文件夹中。 所有的工作流程都有一些共同的 jars 大约 6mb 大小,我必须在每个 lib 文件夹中复制相同的 jar。 您能否告 ...

如何在 Dataproc 中使用 GCS 存储桶作为 Oozie 的工作流文件源 - How to use GCS bucket as workflow file source for Oozie in Dataproc

我们正在将 EMR 集群迁移到 Dataproc,并且我们依靠 Oozie 来运行我们的工作流。 第一个挑战是如何从 Cloud Storage 存储桶加载workflow.xml 。xml。 我们曾经使用 S3 来做到这一点: 尝试在 GCS 上使用相同的方法根本不起作用 当我尝试运行 Oozie ...

OOZIE Spark 操作:有时不会出现此类方法错误 - OOZIE Spark Action : Getting No such method error sometimes

我在通过 ooze 执行火花动作时遇到了这个异常。 有时工作运行良好,有时我得到这个异常。 真的很奇怪,不知道为什么会这样。 我在 oozie lib 和我的应用程序 jar 中检查了 spark jar 的版本,它是相同的(无冲突) 任何可能导致这种行为的建议。 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM