繁体   English   中英

oozie 工作流抛出 Socket 错误,但在 10 分钟后提交了两次工作流

[英]oozie workflow throws Socket error but submits the workflow twice after 10 minutes

我面临着非常奇怪的问题。 我有工作流 xml,其中包含 20 个 fork-join 节点,每个节点包含 4-8 个 actions 。 当我提交此工作流程时,它等待 5-6 分钟,抛出

"Error: IO_ERROR : java.net.SocketException: Connection reset"

但实际上在后台发生的是它在 10 分钟后提交一个工作流,12 分钟后提交另一个工作流。 所以它最终会触发它两次。

我尝试验证我的 xml & 它返回“OK”。 由于它没有返回工作流程,我无法进行调试。 老实说,我什至不确定从哪里开始调试。

我的工作流程与较小的 fork(6) 类似,它们都可以正常工作。 但不知道为什么这个会引起所有的麻烦。

您上面的错误看起来更像是从客户端。 我认为检查服务器日志是个好主意。

oozie job -oozie http://localhost:11000 -info <wfid>
oozie job -oozie http://localhost:11000 -log <wfid>

也有可能您正在使用无效的 Oozie URL。 例如,如果您的集群进行了 kerberized,则您必须使用与 kerberos 主体匹配的 Oozie URL。 如果您从 kerberized 环境中运行,请尝试使用原则和密钥表( kinit user_principle -k -t key_tab )进行kinit user_principle -k -t key_tab ,然后在命令中使用 FQN 和kinit user_principle -k -t key_tab服务器名称,如下所示

oozie job -oozie http://node_name@domain:11000/oozie -config xxxx -run

这些日志没有提供任何有意义的信息。 所以我将我的工作流文件分成 2 个 xml。 我从第一个工作流的最后一个操作中调用了第二个工作流。它运行良好,没有任何问题。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM