[英]Databricks + H2O PySparkling: addURL Py4JException
我是H2O和spark框架的新手,在Databricks中上H2O+Spark (sparkling-water)
PySparkling時遇到了麻煩。 我在1.5.2環境中的Databricks中運行了12個工人集群。
我采取的步驟如下:
1.將H2O所需的必要庫(六個,請求,列表和將來的庫)附加(安裝)到我的集群中
然后,從sparkling-water-1.5.14.zip包解壓縮后,我從sparkling-water-1.5.14/py/dist
文件夾中sparkling-water-1.5.14/py/dist
了必要的.egg文件。
我還將sparkling-water-assembly-1.5.14.jar
到了我的Databricks集群
我能夠成功import h2o
。 但是,當我在Databricks的python NB中運行以下單元格時,出現以下異常:
在Spark上啟動H2OContext
from pysparkling import * hc = H2OContext(sc).start() import h2o
我收到以下錯誤
py4j.Py4JException: Method addURL([class java.net.URL]) does not exist
衷心感謝您提供有關如何解決此異常的任何指導。
這是PySparkling中的錯誤 。 已經提交了一個修復程序,但仍在等待下一個版本,可能在1.5.15中引入。
您可以嘗試從該分支機構自己構建起泡水,並在我們發布下一個版本之前使用它。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.