[英]XML File Validation Against Azure SQL Server in Azure Data Factory
我的XML文件 (位于Azure Blob容器中)
<?xml version="1.0" encoding="utf-8"?>
<Details xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<Person>
<id>2</id>
<name>XXX</name>
<age>12</age>
</Person>
</Details>
我的Azure SQL Server表
表名: UserTABLE
ID | NAME | AGE | GENDER
1 | JAY | 12 | MALE
2 | XXX | 11 | MALE
我想将XML文件与上述Azure SQL服务器(UserTABLE)进行比较,如果匹配,那么我想将XML文件中的其他字段更新 到我的UserTable中 ,否则,我想作为新行插入 Azure SQL中从XML到我的UserTable的所有给定字段值的服务器
谁能建议我该如何进行?
您可以使用登台表,在其中将截断/加载xml数据,然后从同一ADF调用存储的proc,以根据登台表中的此登台数据进行插入/更新。 在下一次运行期间,它将截断表,然后再次执行相同的过程。 所有这些都可以通过您现有的ADF完成。
Azure SQL数据库最近获得了使用BULK INSERT或OPENROWSET从Azure Blob存储加载文件的功能。 从这里开始。
以示例代码和数据为例,您可以导入xml,将其切碎,然后使用MERGE
将其INSERT/UPDATE
到主表中。 一个简单的演示:
DROP TABLE staging
DROP TABLE #tmp
DROP TABLE yourTable
CREATE TABLE staging ( rowId INT IDENTITY PRIMARY KEY, yourXML XML );
CREATE TABLE #tmp ( id INT PRIMARY KEY, name VARCHAR(30) NOT NULL, age INT NOT NULL );
SELECT * INTO yourTable FROM #tmp
INSERT INTO staging
SELECT *
FROM OPENROWSET(
BULK 'archive/temp.xml',
DATA_SOURCE = 'MyAzureBlobStorageAccount',
SINGLE_BLOB
) AS x
INSERT INTO #tmp ( id, name, age )
SELECT
x.c.value('(id/text())[1]', 'int' ) AS id,
x.c.value('(name/text())[1]', 'varchar(30)' ) AS name,
x.c.value('(age/text())[1]', 'int' ) AS age
FROM staging s
CROSS APPLY s.yourXML.nodes('Details/Person') AS x(c)
-- Merge
MERGE INTO dbo.yourTable t
USING
(
SELECT * FROM #tmp
) s ON t.id = s.id
-- Insert new records ( no match on primary key )
WHEN NOT MATCHED BY TARGET
THEN
INSERT ( id, name, age )
VALUES ( id, name, age )
WHEN MATCHED
AND t.name != s.name
OR t.age != s.age
-- Update existing ( no match on primary key )
THEN UPDATE
SET
t.name = s.name,
t.age = s.age;
SELECT *
FROM dbo.yourTable
您要做的最好的事情是暂时忘掉Data Factory。 编写一个SQL脚本,该脚本可以成功完成上述设置并成功运行。 完成该工作后,将其隐藏到存储的proc中。 测试一下。 完成这些工作后,您可以开始考虑Data Factory。 您将需要一个输出数据集,但不需要输入数据集。 在此处完成本教程。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.