如何使用python在spark中執行.sql文件

Question

from pyspark import SparkConf, SparkContext
from pyspark.sql import SQLContext

conf = SparkConf().setAppName("Test").set("spark.driver.memory", "1g")
sc = SparkContext(conf = conf)

sqlContext = SQLContext(sc)

results = sqlContext.sql("/home/ubuntu/workload/queryXX.sql")

當我使用： python test.py執行此命令時，它給出了一個error 。

y4j.protocol.Py4JJavaError：調用o20.sql時發生錯誤。 ：java.lang.RuntimeException：[1.1]失敗：``with''預期但找到`/'

/home/ubuntu/workload/queryXX.sql

at scala.sys.package$.error(package.scala:27)

我對Spark很新，我需要幫助才能繼續前進。

Answer 1

SqlContext.sql期望有效的SQL查詢不是文件的路徑。 試試這個：

with open("/home/ubuntu/workload/queryXX.sql") as fr:
   query = fr.read()
results = sqlContext.sql(query)

Answer 2

運行spark-sql --help會給你

CLI options:
 -d,--define <key=value>          Variable subsitution to apply to hive
                                  commands. e.g. -d A=B or --define A=B
    --database <databasename>     Specify the database to use
 -e <quoted-query-string>         SQL from command line
 -f <filename>                    SQL from files
 -H,--help                        Print help information
    --hiveconf <property=value>   Use value for given property
    --hivevar <key=value>         Variable subsitution to apply to hive
                                  commands. e.g. --hivevar A=B
 -i <filename>                    Initialization SQL file
 -S,--silent                      Silent mode in interactive shell
 -v,--verbose                     Verbose mode (echo executed SQL to the
                                  console)

所以你可以像這樣執行你的sql腳本：

spark-sql -f <your-script>.sql

Answer 3

我不確定它會回答你的問題。 但是，如果您打算在現有表上運行查詢，則可以使用，

spark-sql -i <Filename_with abs path/.sql>

還有一件事，如果你有pyspark腳本，你可以在這里使用spark-submit細節。

如何使用python在spark中執行.sql文件

問題描述

3 個解決方案

解決方案1
4 2015-10-06 07:04:59

解決方案2
3 2016-07-20 07:15:06

解決方案3
0 2015-10-06 05:17:29

如何使用python在spark中執行.sql文件

問題描述

3 個解決方案

解決方案1 4 2015-10-06 07:04:59

解決方案2 3 2016-07-20 07:15:06

解決方案3 0 2015-10-06 05:17:29

解決方案1
4 2015-10-06 07:04:59

解決方案2
3 2016-07-20 07:15:06

解決方案3
0 2015-10-06 05:17:29