简体   繁体   English

Azure 数据工厂复制数据架构映射与接收器 Datalake

[英]Azure Data Factory Copy Data schema mapping with sink Datalake

I have a simple pipeline , with copydata.我有一个简单的管道,带有复制数据。 I am trying to pull data from sql to data lake .我正在尝试将数据从 sql 提取到数据湖。 I have created two datasets one for sql and other for datalake.我创建了两个数据集,一个用于 sql,另一个用于 datalake。

Data lake schema are defined in dataset are overridden when we run the pipeline and columns have string data type.当我们运行管道并且列具有字符串数据类型时,在数据集中定义的数据湖模式会被覆盖。

I tried to change the schema data type here and after running the pipelines they are overridden in datasets.我尝试在此处更改架构数据类型,并在运行管道后在数据集中覆盖它们。

Schema Mapping in CopyData CopyData 中的模式映射

DataSet Schema definition数据集架构定义

When we copy data from SQL to Azure Data Lake Storage, no matter what the column data type is in SQL Source dataset, it all will change to String in Data Lake Storage Sink dataset.当我们将数据从 SQL 复制到 Azure Data Lake Storage 时,无论 SQL Source 数据集中的列数据类型是什么,在 Data Lake Storage Sink 数据集中都会变成 String。 Sink dataset will create a flat file(txt, json and so on) to store the data. Sink 数据集将创建一个平面文件(txt、json 等)来存储数据。

在此处输入图片说明

For example, when you copy data from a csv file as Source dataset, import the schema from source file, all the column data types are String.例如,当您从 csv 文件复制数据作为源数据集时,从源文件导入架构时,所有列数据类型都是字符串。 We only can change these String column data type during SQL Sink dataset schema mapping.我们只能在 SQL Sink 数据集模式映射期间更改这些 String 列数据类型。

We can not not change the data types for datesets when using sink as Data lake Storage.使用 sink 作为数据湖存储时,我们不能更改日期集的数据类型。

Hope this helps.希望这可以帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用 Azure 数据工厂将 Sharepoint 在线 csv 复制到数据湖 - Copy Sharepoint online csv to datalake using Azure Data Factory Azure 数据工厂复制活动失败将字符串(从 csv)映射到 Azure SQL 表接收器 uniqueidentifier 字段 - Azure Data factory copy activity failed mapping strings (from csv) to Azure SQL table sink uniqueidentifier field 来自 Salesforce 的 Azure 数据工厂管道,在接收器映射中添加时间戳 - Azure Data Factory Pipeline from Salesforce, add a Timestamp in Sink Mapping Azure数据工厂-源到接收器自定义映射,将字符串转换为对象 - Azure Data Factory - Source to Sink custom mapping converting string to object Azure SQL 具有接收器存储过程的数据工厂复制活动 - Azure SQL Data Factory Copy Activity with Sink Stored Procedure Azure 数据工厂中的条件接收器 - Conditional sink in Azure data factory 将 FHIR 数据的 Azure API 复制到数据湖中 - Copy Azure API for FHIR data into datalake 使用触发器中的 Azure 数据工厂复制数据活动映射 - Azure Data Factory Copy Data Activity Mapping in Using Triggers 无法在 Azure 数据工厂的复制活动中向接收器“Azure 数据资源管理器”添加额外的列 - Not able to add additional column to the sink `Azure Data Explorer` in the Copy Activity of Azure Data Factory Azure 数据工厂 - 复制数据 - 映射 - 动态内容表达式 - Azure Data Factory - Copy data - mapping - dynamic content expression
 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM