简体繁体 English

我们可以使用 spark 池来处理来自专用 SQL 池的数据吗，这是一个好的架构吗？

[英]Can we use spark pool to process data from dedicated SQL pool and is that a good architecture?

原文 2022-03-09 14:31:53 6 1 sql/ apache-spark/ pool/ azure-synapse/ dedicated

Is it a good design to use spark pool for processing data which comes in dedicated SQL pool and again write back to dedicated SQL pool and to adls.使用火花池处理专用 SQL 池中的数据并再次写回专用 SQL 池和 adls 是否是一个好的设计。

As of now everything we r doing with dedicated SQL pool so if we add spark pool so will it be more efficient or it will just be burden to existing dedicated SQL pool.截至目前，我们 r 使用专用 SQL 池所做的一切，所以如果我们添加火花池，它会更有效率，否则只会成为现有专用 SQL 池的负担。

1 个解决方案

Yes, you can use spark pool to process data from dedicated SQL pool and is that a good architecture as there it is recommended and directly support by Microsoft Officials.是的，您可以使用 spark 池来处理来自专用 SQL 池的数据，这是一个很好的体系结构，因为 Microsoft 官方推荐并直接支持它。

The Synapse Dedicated SQL Pool Connector is an API that efficiently moves data between Apache Spark runtime and Dedicated SQL pool in Azure Synapse Analytics. Synapse 专用 SQL 池连接器是一个 API，可在 Apache Spark 运行时和 Azure Synapse Analytics 中的专用 SQL 池之间高效移动数据。 This connector is available in Scala.此连接器在 Scala 中可用。

If your project required large scale streaming you can definitely go for Apache Spark.如果您的项目需要大规模流式传输，您绝对可以使用 go 来使用 Apache Spark。 There won't be any burden on existing architecture.不会对现有架构造成任何负担。 You will get expected results.你会得到预期的结果。

Refer: Azure Synapse Dedicated SQL Pool connector for Apache Spark参考： Azure Synapse Dedicated SQL Pool connector for Apache Spark

使用 pyspark 将数据从 adls 推送到专用的 sql 池 - Push data from adls to dedicated sql pool with pyspark

将数据写入 Azure 中的特定分区 Dedicated SQL pool - Write data to specific partitions in Azure Dedicated SQL pool

Azure Synapse Dedicated SQL Pool 中物理存储的数据在哪里？ - Where is data physically stored in Azure Synapse Dedicated SQL Pool?

将 Synapse Workspace 连接到现有的专用 SQL 池 - Connecting Synapse Workspace to existing Dedicated SQL Pool

ODBC 连接到 Synapse 专用 SQL 池数据库通过带有 pyodbc 的 spark Notebook 时出错 - Error in ODBC Connection to Synapse Dedicated SQL Pool DB via spark Notebook with pyodbc

我们可以从管道 azure 突触在无服务器池中执行 sql 查询吗？ - can we execute sql query in serverless pool from pipeline azure synapse?

无法使用给定凭据访问 Azure 专用 SQL 池 - Failed to access the Azure Dedicated SQL pool with the given credentials

如何使用 dbt 将镶木地板文件从 Azure Data Lake Gen2/Azure Blob 存储加载到专用池？ - How to load parquet files from Azure Data Lake Gen2/Azure Blob Storage to Dedicated pool using dbt?

Synapse 无服务器 SQL 池中的数据屏蔽 - Data masking in Synapse serverless SQL pool

通过不检测重复但有欺骗来分组。奇怪 SQL 服务器 - Azure Synapse 数据库专用 SQL 池 - Group by not detecting duplicates but there are dupes. Strange SQL Server - Azure Synapse database dedicated SQL pool

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用 pyspark 将数据从 adls 推送到专用的 sql 池 - Push data from adls to dedicated sql pool with pyspark 将数据写入 Azure 中的特定分区 Dedicated SQL pool - Write data to specific partitions in Azure Dedicated SQL pool Azure Synapse Dedicated SQL Pool 中物理存储的数据在哪里？ - Where is data physically stored in Azure Synapse Dedicated SQL Pool? 将 Synapse Workspace 连接到现有的专用 SQL 池 - Connecting Synapse Workspace to existing Dedicated SQL Pool ODBC 连接到 Synapse 专用 SQL 池数据库通过带有 pyodbc 的 spark Notebook 时出错 - Error in ODBC Connection to Synapse Dedicated SQL Pool DB via spark Notebook with pyodbc 我们可以从管道 azure 突触在无服务器池中执行 sql 查询吗？ - can we execute sql query in serverless pool from pipeline azure synapse? 无法使用给定凭据访问 Azure 专用 SQL 池 - Failed to access the Azure Dedicated SQL pool with the given credentials 如何使用 dbt 将镶木地板文件从 Azure Data Lake Gen2/Azure Blob 存储加载到专用池？ - How to load parquet files from Azure Data Lake Gen2/Azure Blob Storage to Dedicated pool using dbt? Synapse 无服务器 SQL 池中的数据屏蔽 - Data masking in Synapse serverless SQL pool 通过不检测重复但有欺骗来分组。奇怪 SQL 服务器 - Azure Synapse 数据库专用 SQL 池 - Group by not detecting duplicates but there are dupes. Strange SQL Server - Azure Synapse database dedicated SQL pool

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM