繁体   English   中英

我需要在我的 Spark 集群的每个节点上安装 Koalas 还是只在主节点上安装 Koalas?

[英]Do I need to install Koalas on every node of my Spark cluster or just on the master node?

我在 Spark+AI 峰会上发现了考拉,它将pandas带到了 Spark。

As far as I know if I need to map a third party function to a Spark DataFrame , I have to install the package on every node of my Spark cluster.

考拉也是这样吗? 或者我只需要在我的主节点上运行pip install koalas并让 Koalas 和 Spark 来处理 rest?

除了pip install koalas之外,我还没有在 Koalas 的文档中找到任何详细信息。

是的,您需要在集群的所有节点上安装考拉。 通常,所有第 3 方库都需要安装在集群的所有节点上。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM