簡體 English 中英

如何在特定時間在Apache Spark上部署和運行Python腳本？

[英]How to deploy and run at a specific time Python scripts on Apache Spark?

原文 2015-05-11 10:13:01 5 1 python/ python-2.7/ deployment/ apache-spark/ pyspark

我有一組簡單的python 2.7腳本。 另外，我有一套Linux節點。 我想在特定時間在這些節點上運行這些腳本。

每個腳本可以在每個節點上工作。 該腳本不能同時在多個節點上運行。

因此，我想完成3個簡單的任務：

部署腳本集。
要在特定時間在任何節點上運行具有特定參數的主腳本。
為了獲得結果，腳本完成后。

看來，我能夠完成第一個任務。 我有以下代碼片段：

import urllib
import urlparse
from pyspark import SparkContext


def path2url(path):
    return urlparse.urljoin(
        'file:', urllib.pathname2url(path))

MASTER_URL = "spark://My-PC:7077"
deploy_zip_path = "deploy.zip"
sc = SparkContext(master=("%s" % MASTER_URL), appName="Job Submitter", pyFiles=[path2url("%s" % deploy_zip_path)])

但是我有問題。 此代碼立即啟動任務。 但是我只想將腳本部署到所有節點。

1 個解決方案

我建議保留代碼以在PySpark腳本之外部署PySpark腳本。
Chronos是在Apache Mesos上運行的作業計划程序。 Spark可以在Mesos上運行。 Chronos將作業作為shell命令運行。 因此，您可以使用指定的任何參數運行腳本。 您將需要將Spark和腳本部署到Mesos節點。 然后，您可以使用spark-submit作為命令，使用Chronos運行提交您的Spark腳本。
您可以通過在PySpark腳本中寫入某種存儲機制來存儲結果。 Spark支持文本文件，HDFS，Amazon S3等。 如果Spark不支持您需要的存儲機制，則可以使用支持該功能的外部庫。 例如，我使用cassandra-driver在PySpark腳本中寫給Cassandra 。

如何在 Apache Spark 中的 Dataframe 上運行 Python 中的正則表達式

[英]How to run Regex in Python on a Dataframe in Apache Spark

如何在 Python 的特定時間運行特定的 function？

[英]How to run a specific function on a specific time in Python?

如何在 python 中運行腳本？

[英]How to run scripts in python?

如何運行 python 腳本？

[英]How to run python scripts?

如何使用scala或python在apache spark中運行多線程作業？

[英]How to run Multi threaded jobs in apache spark using scala or python?

在apache上運行python腳本（Linux和Windows）

[英]run python scripts on apache (linux and windows)

如何在 Windows 上同時運行兩個 Python 腳本

[英]How to run two Python scripts at the same time on Windows

在特定時間運行 Python

[英]Run Python At Specific Time

如何讓python腳本在特定時間運行？

[英]How to make python script to run at specific time?

如何從特定時間運行Python腳本

[英]How to run a Python script from a specific time

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在 Apache Spark 中的 Dataframe 上運行 Python 中的正則表達式如何在 Python 的特定時間運行特定的 function？如何在 python 中運行腳本？如何運行 python 腳本？如何使用scala或python在apache spark中運行多線程作業？在apache上運行python腳本（Linux和Windows）如何在 Windows 上同時運行兩個 Python 腳本在特定時間運行 Python 如何讓python腳本在特定時間運行？如何從特定時間運行Python腳本

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM