簡體   English   中英

如何從conda的site-package目錄中添加一個Python模塊進行Spark-Submit?

[英]How do I add a Python module from inside conda's site-package directory to spark-submit?

我需要運行PySpark應用程序(v1.6.3)。 --py-files標志可添加.zip,.egg或.py文件。 如果我在/usr/anaconda2/lib/python2.7/site-packages/fuzzywuzzy有一個Python軟件包/模塊,我將如何包括整個模塊?

在此目錄中,我確實注意到一些* .py和* .pyc文件。

  • fuzz.py
  • process.py
  • StringMatcher.py
  • string_processing.py
  • utils.py

我是否必須一一包括這些內容? 例如。

spark-submit \
 --py-files /usr/anaconda2/lib/python2.7/site-packages/fuzzywuzzy/fuzz.py,/usr/anaconda2/lib/python2.7/site-packages/fuzzywuzzy/process.py,/usr/anaconda2/lib/python2.7/site-packages/fuzzywuzzy/StringMatcher.py,/usr/anaconda2/lib/python2.7/site-packages/fuzzywuzzy/string_processing.py,/usr/anaconda2/lib/python2.7/site-packages/fuzzywuzzy/utils.py

有更容易的方法嗎?

  • 我應該嘗試找到.egg或.zip並使用它(例如pypi )嗎?
  • 我可以壓縮該目錄並將其傳遞嗎?

任何提示或指示,將不勝感激。 實際上,我需要由conda管理的更多Python模塊。

我建議朝其他方向做。 使用pysparkpyspark安裝到Anaconda:

conda install -c conda-forge pyspark=2.1.1

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM