繁体 English 中英

如何使用带有sklearn的第三方软件包的python为蜂巢创建udf？

[英]How to create an udf for hive using python with 3rd party package like sklearn?

原文 2017-03-21 12:26:38 5 1 python/ hive/ package/ udf

我知道如何通过transform和using来创建配置单元sklearn ，但是我不能使用sklearn因为并不是配置单元集群中的所有节点都具有sklearn 。
我的sklearn有anaconda2.tar.gz ，我该怎么办？

1 个解决方案

我最近开始研究这种方法，我觉得问题不是要让所有“ hive节点”上都带有sklearn（如上所述），我觉得这是一个兼容性问题，而不是“ sklearn节点可用性”一。 我认为sklearn尚未（设计）为以并行算法运行，因此可以在短时间内处理大量数据。

作为一种方法，我想做的是通过“ pyhive”将python与“ hive”进行通信，并在该代码中实现必要的sklearn库/调用。 这里的粗略假设是，此“ sklearn-hive-python”代码将在每个节点中运行，并在“ map-reduce”级别处理数据。 我不能说这是正确的解决方案或正确的方法（但是），但这是我经过一段时间搜索后可以得出的结论。

在Python中安装第三方软件包

[英]Installation of 3rd party package in Python

在Python中使用第三方库

[英]Using 3rd Party Libraries in Python

如何在Python中安装第三方模块？

[英]How to install a 3rd party module in Python?

jython找不到第三方python软件包（使用miniconda安装的python）

[英]jython can't find 3rd party python package (python installed using miniconda)

Python覆盖第3方包单个文件

[英]Python override 3rd party package single file

在Python中进行构建时，如何包含第三者软件包？

[英]How can I include a 3rd party package when I build in Python?

如何判断一个包/模块是否是 Python 标准库的一部分？没有第三方库

[英]How can I tell if a package/module is part of Python's std library? without a 3rd party library

是否有适用于python的第三方编译器？

[英]Is there a 3rd party compiler for python?

如何使用Python进行Timestamp转换在HIVE中创建UDF

[英]How to create a UDF in HIVE using python for a Timestamp transformation

如何使用python保护来自第三方Android应用程序的请求信息

[英]how to protect request information from 3rd party android apps using python

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Python中安装第三方软件包在Python中使用第三方库如何在Python中安装第三方模块？ jython找不到第三方python软件包（使用miniconda安装的python） Python覆盖第3方包单个文件在Python中进行构建时，如何包含第三者软件包？如何判断一个包/模块是否是 Python 标准库的一部分？没有第三方库是否有适用于python的第三方编译器？如何使用Python进行Timestamp转换在HIVE中创建UDF 如何使用python保护来自第三方Android应用程序的请求信息

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM