簡體   English   中英

使用Spark在python中運行獨立應用程序示例時出錯

[英]Error while running standalone app example in python using spark

我剛剛開始使用Spark,並在Amazon EC2實例上以獨立模式運行它。 我正在嘗試文檔中提到的示例,並且在瀏覽名為Simple App的示例時,我不斷收到此錯誤:NameError:未定義名稱'numAs'

from pyspark import SparkContext

logFile = "$YOUR_SPARK_HOME/README.md"  # Should be some file on your system
sc = SparkContext("local", "Simple App")
logData = sc.textFile(logFile).cache()

numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()

print "Lines with a: %i, lines with b: %i" % (numAs, numBs)

如何將編輯器集成到spark中而不使用此動態python shell? 為什么我不斷收到此錯誤?

感謝您的幫助/指導。

將您所有的python代碼放入.py文件 ,然后提交.py文件,如下所示:

# Run a Python application on a Spark Standalone cluster
./bin/spark-submit \
  --master spark://207.184.161.138:7077 \
  examples/src/main/python/pi.py \
  1000

在這里閱讀:

提交申請

試試這些例子,確實有幫助:

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM