cost 321 ms
从 Airflow PostgresOperator 中的 conf 传递参数 - Passing Parameter from conf in Airflow PostgresOperator

想访问API调用中数据传入的config 想在 PostgresOperator 的 sqlquery 中访问 seller_id 上述任务不返回任何数据。 但是当我将参数硬编码为 有用。 还尝试使用 sql 文件和参数,但没有效果。 这种方法也行不通。 它将 {{ dag_run.conf["se ...

需要为 Airflow 与 Azure 连接的有效负载获取正确的 URL - Need to get proper URL for payloads for Airflow connected with Azure

我有四个文件main.py 、 jobs.zip 、 libs.zip和params.yaml ,这些我存储在 Azure 存储帐户容器中。 现在我有了这段代码,它正在制作一个有效负载,并将尝试使用该有效负载运行一个 spark 作业。 该有效负载将具有这 4 个文件的位置链接。 我已经检查了正确 ...

如何使用从创建并返回 DAG 供 UI 查看的模块中导入的 function? - How to use imported function from a module that creates and returns a DAG for UI to see?

我创建了一个名为dag_template_module.py的模块,它使用指定的 arguments 返回 DAG。我想将此定义用于多个 DAG,做同样的事情,但来自不同的来源(因此参数)。 dag_template_module.py的简化版本: 现在我创建了一个hello_world_dag ...

如何通过 PostgresOperator 在配置模板中使用 conn_id 运行 Airflow dag? - How to run Airflow dag with conn_id in config template by PostgresOperator?

我有一个带有 PostgresOperator 的 Airflow dag 来执行 SQL 查询。 我想使用配置(运行 w/config)切换到我的测试数据库或我的产品数据库。 但是 postgres_conn_id 不是模板字段,因此 PostgresOperator 说“{{ dag_run. ...

Apache-airflow 2.5.0:如何在 Python VirtualEnv Operator 中使用配置 JSON - Apache-airflow 2.5.0: How to utilize config JSON in Python VirtualEnv Operator

我的 Apache airflow 版本是2.5.0。 我想访问和使用在触发 DAG 时设置的配置 json 的值。 我已经尝试了以下给定的问题解决方案,但没有一个有效。 配置在配置 json 部分: {“conf1”:“测试”} 我想在我的 Python VirtualEnv Operator ...

Airflow dag 在完成 stop_dag 任务后执行中间任务,如何停止其他任务想要依赖即使父任务没有运行 - Airflow dag executing middle tasks after completing stop_dag task, how to stop other tasks want to dependency even though parent task did not ran

这是停止执行步骤后的图像,突出显示的步骤正在运行,没有任何依赖性。 请在 stop_dag 任务运行完成后帮助停止其他任务。 ...

Snakemake 规则的优先级高于所有其他规则 - Snakemake rule higher priority than all other rules

所以我知道为了设置规则优先级,你使用ruleorder 。 有没有一种有效的方法可以使规则优先于所有其他规则? 例如,假设我有规则a 、 b和c 。 我希望规则b比a和c具有更高的优先级。 除了手动执行ruleorder: b > c和ruleorder: b > a之外,我该怎么做? ...

在 Networkx 中获取权重组合边 - Get weight combining edges in Networkx

您好,我正在使用 Networkx 和 Python 制作一些图表。 从结构为“源”和“目标”的 a.CSV 中提取边缘后,我得到了如下边缘列表: 有没有什么方法可以构建(在使用这些边创建 MultiDiGraph 之后)一个有向图,它结合了相等的边,将权重作为相同边的出现次数,结果如下: 我已经实 ...

Airflow 任务卡在“排队”中 state。依赖项阻止任务被安排 - Airflow task stuck in 'queued' state. Dependencies Blocking Task From Getting Scheduled

我有以下 Airflow DAG,它将单个本地文件上传到 S3 存储桶中。 DAG 在 Airflow 中导入,没有任何错误,但是当我尝试强制运行时,它没有执行任何操作,如下面的屏幕截图所示: 当我检查任务实例详细信息时,它说“依赖项阻止任务被安排。DependencyReasonTask 实例 ...

如何让 DAG 中的 sql 语句识别我正在从 Airflow 调用参数? - How do I get the sql statement in the DAG to recognize that I'm calling a parameter from Airflow?

我想从 Airflow 调用 dag 运行时,但是,我的语法中的某些内容已关闭,我需要帮助来更正它。 我试过这个代码片段 然后在 DAG 中调用它。 但它只是插入文本:'{{ data_interval_start }}',而不是日期/ts ...

仅当全局变量设置为 true 时才运行任务 - run tasks only if global variable is set to true

我有一个看起来像这样的 DAG: dag1: 然后我有一个全局 Airflow 变量"STATUS" 。 在运行clean步骤之前,我想检查“STATUS”变量是否为真。 如果是这样,那么我想继续执行“清理”任务。 否则,我想一直等待 state,直到全局变量“STATUS”变为真。 是这样的: ...

如果另一个 dag 完成,则在 dag 中运行下一个任务 - run next tasks in dag if another dag is complete

dag1: 我有一个 dag,我在那里运行一些任务。 但我想对其进行修改,以便仅当另一个 dag“dag2”目前未运行时才运行clean的步骤。 有什么方法可以导入关于我的“dag2”的信息,检查它的状态,如果它处于成功模式,我可以继续执行clean的步骤,就像这样: 如何实现wait_for_d ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM