简体   繁体   English

Azure 数据流中的聚合返回无效值

[英]Aggregation in Azure Data Flow is Returning Invalid Value

I have created a data flow in Data Factory.我在数据工厂中创建了一个数据流。 Step 1. Read the parquet file.步骤 1. 阅读 parquet 文件。 Step 2. Aggregate the file to get the Max(DateField) Step 3. Use a derived column to write in a Value.步骤 2. 聚合文件以获得 Max(DateField) 步骤 3. 使用派生列写入值。 Step 4. Alter row task with Value and the DateField.步骤 4. 使用 Value 和 DateField 更改行任务。 Step 5. Sink select the Watermark table to update.步骤 5. 接收要更新的水印表 select。

The flow updates the value, but it isn't putting in the max value.流程更新了值,但没有输入最大值。 The date value is incorrect.日期值不正确。 Any ideas?有任何想法吗? Flow_image Flow_image

max() aggregate function doesn't work on date/string format type. max()聚合 function 不适用于日期/字符串格式类型。 You must pass any column which contains numerical values.您必须传递任何包含数值的列。 Date is not a valid input on which you can apply max function.日期不是您可以应用最大 function 的有效输入。 There is no maximum date term.没有最长的日期期限。

Instead you can filter the timestamp and get the latest or oldest date using ADF.相反,您可以过滤时间戳并使用 ADF 获取最新或最旧的日期。

Refer this answer by @Leon to know how to implement the same.请参考@Leon 的这个答案,以了解如何实现它。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM