繁体 English 中英

适合分布式，独立预测

[英]fit in distributed, predict in a stand alone

原文 2016-08-19 14:00:49 0 1 apache-spark/ jvm/ pmml

如何在分布式大数据平台（例如Apache Spark）中训练（拟合）模型，而又在依赖关系尽可能少的独立机器（例如JVM）中使用该模型？

我听说过PMML，但不确定是否足够。 此外，Spark 2.0还支持持久保存模型，但是我不确定加载和运行这些模型需要什么。

1 个解决方案

Apache Spark持久性是关于以JSON数据格式保存和加载Spark ML管道（可以将其视为Python的pickle机制或R的RDS机制）。 这些JSON数据结构映射到Spark ML类。 它们在其他平台上没有意义。

至于PMML，则可以使用JPMML-SparkML库将Spark ML管道转换为PMML文档。 您可以使用JPMML-Evaluator库执行PMML文档（无论它们来自Apache Spark，Python还是R）。 如果您使用Apache Maven来管理和构建项目，则可以通过在项目的POM中仅添加一个依赖项声明来包括JPMML-Evaluator。

SparkLauncher 独立集群模式

[英]SparkLauncher Stand Alone Cluster Mode

找不到火花独立式群集罐

[英]spark stand alone cluster jar not found

构建独立Spark 1.3.1时出错

[英]Error on building stand-alone Spark 1.3.1

带有Spark Stand Alone集群的应用程序UI

[英]Application UI with Spark Stand Alone Cluster

Spark独立安装程序中的内存使用情况

[英]Memory usage in Spark stand alone setup

Spark 0.90独立连接被拒绝

[英]Spark 0.90 Stand alone connection refused

Spark独立模式：以编程方式提交作业

[英]Spark stand alone mode: Submitting jobs programmatically

Spark 独立集群文件访问

[英]Spark stand alone cluster file access

如何在独立群集上正确提交spark作业

[英]how to properly submit spark jobs on a stand-alone cluster

apache spark独立使用casbah与scala连接到mongodb

[英]apache spark stand alone connecting to mongodb with scala using casbah

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 SparkLauncher 独立集群模式找不到火花独立式群集罐构建独立Spark 1.3.1时出错带有Spark Stand Alone集群的应用程序UI Spark独立安装程序中的内存使用情况 Spark 0.90独立连接被拒绝 Spark独立模式：以编程方式提交作业 Spark 独立集群文件访问如何在独立群集上正确提交spark作业 apache spark独立使用casbah与scala连接到mongodb

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM