[英]oozie workflow throws Socket error but submits the workflow twice after 10 minutes
我面临着非常奇怪的问题。 我有工作流 xml,其中包含 20 个 fork-join 节点,每个节点包含 4-8 个 actions 。 当我提交此工作流程时,它等待 5-6 分钟,抛出
"Error: IO_ERROR : java.net.SocketException: Connection reset"
但实际上在后台发生的是它在 10 分钟后提交一个工作流,12 分钟后提交另一个工作流。 所以它最终会触发它两次。
我尝试验证我的 xml & 它返回“OK”。 由于它没有返回工作流程,我无法进行调试。 老实说,我什至不确定从哪里开始调试。
我的工作流程与较小的 fork(6) 类似,它们都可以正常工作。 但不知道为什么这个会引起所有的麻烦。
您上面的错误看起来更像是从客户端。 我认为检查服务器日志是个好主意。
oozie job -oozie http://localhost:11000 -info <wfid>
oozie job -oozie http://localhost:11000 -log <wfid>
也有可能您正在使用无效的 Oozie URL。 例如,如果您的集群进行了 kerberized,则您必须使用与 kerberos 主体匹配的 Oozie URL。 如果您从 kerberized 环境中运行,请尝试使用原则和密钥表( kinit user_principle -k -t key_tab
)进行kinit user_principle -k -t key_tab
,然后在命令中使用 FQN 和kinit user_principle -k -t key_tab
服务器名称,如下所示
oozie job -oozie http://node_name@domain:11000/oozie -config xxxx -run
这些日志没有提供任何有意义的信息。 所以我将我的工作流文件分成 2 个 xml。 我从第一个工作流的最后一个操作中调用了第二个工作流。它运行良好,没有任何问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.