簡體 English 中英

Flink按字段ID對記錄進行分組的最佳方法

[英]Flink best way to group records by field id

原文 2019-07-09 12:47:51 7 1 java/ apache-kafka/ apache-flink/ flink-streaming

我正在設置與Kafka代理連接的Apache Flink。

我以隨機順序收到以下消息：

消息（時間戳= [..]，索引= 1，someData = [..]）
消息（時間戳= [..]，索引= 2，someData = [..]）
消息（時間戳= [..]，索引= 3，someData = [..]）
消息（時間戳= [..]，索引= 2，someData = [..]）
消息（時間戳= [..]，索引= 3，someData = [..]）
消息（時間戳= [..]，索引= 1，someData = [..]）

我來自Kafka的記錄有一個index字段。

在我的應用程序中，我需要計算出具有相同ID的最后兩個記錄，然后立即發送響應。

例如，這兩個：

消息（時間戳= [..]，索引= 1，someData = [..]）
消息（時間戳= [..]，索引= 1，someData = [..]）

存儲和計算具有相同索引字段的最后兩個記錄的最佳方法是什么？ 你能告訴我一些提示嗎？

1 個解決方案

您的要求尚不完全清楚，但是您可能想了解的機制是使用keyBy(e -> e.index)按索引字段keyBy(e -> e.index)進行分組/分區，並使用鍵控狀態來記住上一個（或兩個）事件對於索引的每個值。

如果您需要考慮時間戳，並且事件流是亂序的，即使在索引的單個值之內，那么您將需要首先按時間戳對流進行排序。 在這種情況下，如果您使用Flink SQL進行排序，您將擁有更加輕松的時間，然后您可以使用match_recognize進行模式識別，盡管對於這樣一個簡單的模式而言，這可能會顯得有些過時。 這是如何進行排序的示例。

為枚舉創建唯一ID字段的最佳方法

[英]Best way to create a Unique ID field for an enum

TOP [N]記錄組按用戶查詢以最佳方式查詢

[英]TOP [N] Records Group By per user query in the best possible way

在 Flink 中保持 HashMap 狀態的最佳方法是什么

[英]What is the best way to keep a HashMap into the state in Flink

在 Flink 中生成具有當前時間戳的事件的最佳方法是什么？

[英]What is the best way to produce events with current time timestamps in Flink?

在Apache Flink中手動更新狀態的最佳方法是什么？

[英]What's the best way to update the state manually in Apache Flink?

flink：丟失記錄了嗎？

[英]flink: is it losing records?

在hibernate中插入大量記錄的最佳方法

[英]Best way to insert a good amount of records in hibernate

更喜歡允許單個 id 有多個記錄的方法

[英]Prefer way to allow multiple records for single id

按多個字段分組Java對象的最佳方法

[英]Best way to group java objects by multiple fields

在春季通過響應返回小組的最佳方法

[英]Best way to returns a group by response in spring

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 為枚舉創建唯一ID字段的最佳方法 TOP [N]記錄組按用戶查詢以最佳方式查詢在 Flink 中保持 HashMap 狀態的最佳方法是什么在 Flink 中生成具有當前時間戳的事件的最佳方法是什么？在Apache Flink中手動更新狀態的最佳方法是什么？ flink：丟失記錄了嗎？在hibernate中插入大量記錄的最佳方法更喜歡允許單個 id 有多個記錄的方法按多個字段分組Java對象的最佳方法在春季通過響應返回小組的最佳方法

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM