[英]How to run pySpark with snowflake JDBC connection driver in AWS glue
[英]How to update / delete in snowflake from the AWS Glue script
我想删除雪花表中数据框对象中的记录。
同样,我想根据雪花表中数据框中的“键”执行更新。
我的研究表明 utils 方法可以执行 DDL 操作,但我无法找到一些示例来参考。
正如您所提到的,您可以使用 Utils 对象的 runQuery() 方法来执行 DDL/DML SQL 语句:
如果你想根据一些键来做,那么你可以在 DataFrame 上迭代项目,并为每个项目运行一个 SQL:
但这将是一个性能杀手。 Snowflake 是一个数据仓库,因此您应该始终更喜欢“批量更新”而不是单行更新。
我建议您将数据帧写入 Snowflake 中的暂存表,然后调用 SQL 以根据暂存表更新目标表中的行。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.