[英]RuntimeError: Split pattern data/* does not match any files
I'm currently trying to convert the TFX-TFRS tutorial into an Airflow pipeline.我目前正在尝试将TFX-TFRS 教程转换为 Airflow 管道。 When I run this Pipeline with LocalDagRunner() it executes without error.
当我使用 LocalDagRunner() 运行此管道时,它执行时不会出错。 When I use the AirflowDagRunner() it throws the following error (Airflow pipeline is triggered through the Airflow Web-UI):
当我使用 AirflowDagRunner() 时,它会引发以下错误(通过 Airflow Web-UI 触发 Airflow 管道):
RuntimeError: Split pattern data/* does not match any files.
RuntimeError: Split pattern data/* 不匹配任何文件。
Inside the data folder resides a CSV dataset.数据文件夹内有一个 CSV 数据集。
I use the standard CsvExampleGen component in both cases.在这两种情况下,我都使用标准的 CsvExampleGen 组件。
This is the path to the dataset, which gets ingested by the pipeline:这是数据集的路径,它被管道摄取:
PIPELINE_NAME = 'TFRS-ranking'
# Directory where MovieLens 100K rating data lives
DATA_ROOT = os.path.join('data', PIPELINE_NAME)
我通过为 Airflow 管道提供数据的绝对路径而不是相对路径来解决此问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.