[英]ETL pipeline from SQL Server to MongoDB Atlas
我只想使用火花。 从 sqlserver 读取,进行转换并写出到 mongo(sql server --> spark --> mongoDB):
#SQL server
df = (
spark
.read
.format('jdbc')
.option("driver", "com.microsoft.sqlserver.jdbc.SQLServerDriver")
.option('url', 'jdbc url')
.option('user', user)
.option('password', password)
.option('dbtable', 'schema.table')
.option('tempdir', 's3://....')
.option('forward_spark_s3_credentials', 'true')
.load()
)
# Mongo
df = spark.read.format("mongo").option("uri","mongodb://127.0.0.1/people.contacts").load()
df.write.format("mongo").option("uri","mongodb://127.0.0.1/people.contacts").mode("append").save()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.