[英]Cloud Dataflow Python: Failed to install packages: failed to install workflow
[英]Install Python packages in dataflow job
在我的數據流(光束)工作流程中,我使用來自 Python 的日期時間 package(在 gcp 上使用 jupyter notebook)。 當我使用 pip 安裝丟失的包時,一切正常。
現在我想在 gcp 上運行我的轉換作為數據流作業。
我總是得到錯誤“NAME ERROR”,因為日期時間未知(當我使用 Apache beam SDK 用於 Python 時出現此錯誤)任何人都可以提示我如何將 Python 包添加到數據流作業中嗎?
我使用的是 setup.py 文件,但它不起作用。
感謝您的回答,如果我必須安裝一些額外的包 fe lxml,這里是我的setup.py
文件 fe 的一部分
CUSTOM_COMMANDS = [
['sudo', 'apt-get', 'update'],
['sudo', 'apt-get', 'install', 'python3-lxml'],
['sudo', 'apt', 'install', 'python3-pip'],
['pkg', 'install', 'libxml2', 'libxslt']
]
我的問題:
pip install lxml
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.