簡體   English   中英

無法在EMR上導入mrjob

[英]Failed to import mrjob on EMR

所以我試圖運行我的mrjob,但在第一行得到錯誤:

ImportError: No module named mrjob.job

我將按以下方式啟動工作:

python main.py --bootstrap-mrjob -v -r emr --emr-job-flow-id j-XXXXXXXXX ../data/data.txt

我還嘗試將以下行添加到我的mrjobs.conf中:

bootstrap:
- sudo pip install mrjob

沒用 那么如何解決呢?

編輯:實際上,如果我是從命令行創建群集的,那么我不會收到此錯誤,但是如果我要在已經運行的群集上運行腳本,它將失敗並顯示此錯誤。

編輯:所以另一個不同之處是在從命令行創建的群集上,我有以下步驟

  PENDING (cluster is BOOTSTRAPPING: Running bootstrap actions)

但是在已經運行的集群上我沒有它

您需要顯式傳遞mrjobs.conf: -c mrjobs.conf

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM