簡體 English 中英

谷歌數據流作業根據文件模式從雲存儲中讀取 avro 文件

[英]Google dataflow job to read avro files from Cloud storage based on file patterns

原文 2020-11-06 19:21:01 9 1 java/ google-cloud-dataflow

假設 gcs 中的文件以以下格式存儲： -.avro 。 嘗試使用 apache beam 的 FileIO.matchAll 庫在谷歌數據流作業中使用讀取文件來讀取基於時間戳間隔的文件。 示例， gcs 中的文件：

   gs://test-bucket/abc_20200101000000.txt
    gs://test-bucket/abc_20200201000000.txt
    gs://test-bucket/abc_20200301000000.txt

現在我們想要獲取所有大於時間戳 20200101000000 直到當前時間戳的文件，我可以使用什么文件模式？

1 個解決方案

我不知道，如果你能做到這一點與正則表達式，但你應該能夠添加一個ParDo到您的管道下面FileIO.matchAll到過濾元件（類型MatchResult.Metadata基於文件）（ MatchResult.Metadata.resourceId() )。

在數據流作業中從Google雲存儲讀取數據時如何跳過頭文件？

[英]How do I skip header files when reading from google cloud storage in a dataflow job?

Google Dataflow：從 Google Cloud Storage 讀取未綁定的 PCollection

[英]Google Dataflow: Read unbound PCollection from Google Cloud Storage

從BigQuery讀取數據並將其寫入雲存儲中的avro文件格式

[英]Read data from BigQuery and write it into avro file format on cloud storage

清空從PubSub讀取並寫入Google Cloud Storage的Dataflow作業時的數據丟失

[英]Data loss when draining Dataflow job that reads from PubSub and writes to Google Cloud Storage

性能：Google Dataflow將Avro文件寫入GCS

[英]Performance: Google Dataflow writes avro file to GCS

在java中從谷歌雲存儲讀取/下載文件的一部分

[英]Read/download part of file from google cloud storage in java

如何從 Java 中的 Google Cloud Storage 讀取文件

[英]How to read a file from Google Cloud Storage in Java

從Android應用程序中的Google Cloud Storage中讀取文件

[英]Read File from Google Cloud Storage within Android App

將文件從Google Dataflow保存到Google Storage的最簡單方法是什么？

[英]What is the easiest way to save file from Google Dataflow to Google Storage?

使用 Clud Dataflow 將數據從 Google Cloud Sql 讀取到 BigQuery

[英]Read the data from Google Cloud Sql to BigQuery using Clud Dataflow

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 在數據流作業中從Google雲存儲讀取數據時如何跳過頭文件？ Google Dataflow：從 Google Cloud Storage 讀取未綁定的 PCollection 從BigQuery讀取數據並將其寫入雲存儲中的avro文件格式清空從PubSub讀取並寫入Google Cloud Storage的Dataflow作業時的數據丟失性能：Google Dataflow將Avro文件寫入GCS 在java中從谷歌雲存儲讀取/下載文件的一部分如何從 Java 中的 Google Cloud Storage 讀取文件從Android應用程序中的Google Cloud Storage中讀取文件將文件從Google Dataflow保存到Google Storage的最簡單方法是什么？使用 Clud Dataflow 將數據從 Google Cloud Sql 讀取到 BigQuery

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM