繁体 English 中英

从 PySpark 库中引用 Spark (Scala) 库

[英]Referencing a Spark (Scala) library from a PySpark library

原文 2021-05-12 22:09:45 8 1 python/ scala/ apache-spark/ pyspark

我将为 PySpark 客户端构建一个 Python 库。 这个库将调用我已经构建并投入生产的 Spark (Scala) 库。 作为动机（也许还有健全性检查），他们将调用的 Python 库看起来像这样：

from pyspark.sql.DataFrame import PyDataFrame

def process(python_data_frame):
    sc = python_data_frame.rdd.context
    sql_context = python_data_frame.sql_ctx    
    processed_scala_df = sc._jvm.com.mayonesa.ScalaClass.process(python_data_frame._jdf)

    return PyDataFrame(processed_scala_df, sql_context)

我想让我的 PySpark 客户尽可能轻松地导入/使用这个库。 我将如何引用我的 Scala 项目作为此 Python 库的依赖项/在此库中？ 我想避免他们必须向spark-submit命令添加属性（即--jars ）。

1 个解决方案

--jars或--packages是 go 与 3rd 方库（如您的）的典型方式。

如果您想让他们使用您的库的体验不那么痛苦，您可能希望将带有所有额外参数的spark-submit命令包装到包装脚本中，这肯定会使调用更容易。

如何在Jupyter Notebook中使用PySpark时包含外部Spark库

[英]How to include external Spark library while using PySpark in Jupyter notebook

在pyspark上导入python库

[英]Import python library on pyspark

Spark 1.6：如何将从Scala jar生成的RDD转换为pyspark RDD？

[英]Spark 1.6: How do convert an RDD generated from a Scala jar to a pyspark RDD?

Python attrs库和引用实例方法

[英]Python attrs library and referencing instance methods

使用Python请求库引用XML结果

[英]Referencing XML results using Python Requests Library

如何将 Mlib 库添加到 Spark？

[英]How to add Mlib library to Spark?

Spark 集群无法识别 Python 库

[英]Python Library not recognized on Spark Cluster

将自定义 python 库路径添加到 Pyspark

[英]Add custom python library path to Pyspark

在 pyspark 中使用 pandas_udf 中的外部库

[英]Use external library in pandas_udf in pyspark

使用带有 pyspark dataframe 的 h3 库

[英]using h3 library with pyspark dataframe

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在Jupyter Notebook中使用PySpark时包含外部Spark库在pyspark上导入python库 Spark 1.6：如何将从Scala jar生成的RDD转换为pyspark RDD？ Python attrs库和引用实例方法使用Python请求库引用XML结果如何将 Mlib 库添加到 Spark？ Spark 集群无法识别 Python 库将自定义 python 库路径添加到 Pyspark 在 pyspark 中使用 pandas_udf 中的外部库使用带有 pyspark dataframe 的 h3 库

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM