根据条件执行 python 脚本成功/失败

Question

我有一个python脚本，我将使用Pyspark执行该脚本。 python文件如下所示

#!/usr/bin/env python

from datetime import datetime
from pyspark import SparkContext, SparkConf
from pyspark.sql import HiveContext

conf = SparkConf()
sc = SparkContext(conf=conf)
sqlContext = HiveContext(sc)

df = sqlContext.sql("select id, name, start_date from testing.user_123")

hivedb='test'
table='abc_123'

# Register the Data Frame as a TempTable
df.registerTempTable('mytempTable')

# Create Table in Hive using the temptable
status = 'success'
try:
  sqlContext.sql("create table {}.`{}` as select * from mytempTable".format(hivedb,table))
except:
   status = 'fail'

sc.stop()

我得到了想要的结果。 现在，当我在shell script中使用spark -submit -submit 执行此python文件时，我一直处于success状态。

Python script execution as failed if the status message is fail ， success if the status is success

我需要在脚本中更改什么才能获得预期结果。

Answer 1

因为hivedb和table都是硬编码的，并且mytempTable已经存在， "create table {}. {} as select * from mytempTable"将永远成功，如果找不到任何值，它只会创建一个空表。 你需要一个不同的条件来检查; 也许你的select查询的长度？

Answer 2

只需在python脚本的末尾添加一个assert语句。 如果状态变量值不是“成功”，这将使python脚本失败。

assert status == 'success', 'status should be success'

Answer 3

尝试在 try 块中添加 sys.exit(1)

try:
    sqlContext.sql("create table {}.`{}` as select * from mytempTable".format(hivedb,table))
except:
    status = 'fail'
    sys.exit(1)

根据条件执行 python 脚本成功/失败

问题描述

3 个解决方案

解决方案1
0 2017-05-27 06:32:53

解决方案2
0 已采纳 2017-05-27 10:37:50

解决方案3
0 2021-09-29 21:31:54

根据条件执行 python 脚本成功/失败

问题描述

3 个解决方案

解决方案1 0 2017-05-27 06:32:53

解决方案2 0 已采纳 2017-05-27 10:37:50

解决方案3 0 2021-09-29 21:31:54

解决方案1
0 2017-05-27 06:32:53

解决方案2
0 已采纳 2017-05-27 10:37:50

解决方案3
0 2021-09-29 21:31:54