簡體   English   中英

如何使用 Apache Beam 動態地將文件寫入谷歌存儲桶?

[英]How to write files to google bucket using Apache Beam dynamically?

我正在嘗試使用 Apache Beam 將一些文件寫入 google 存儲桶,但文件位置和文件夾名稱是從文件中的第一個索引生成的,那么如何創建此字典並將我的文件寫入其中?

metadata = (data_from_test |'CSVConversionMeta' >> beam.ParDo(WriteToCSVmeta())|'Writing To File' >> beam.io.WriteToText('gs://tester1212/CIK/YEAR/FILING/metadata.csv'))

所以,這是我編寫文件的代碼,但我希望從 csv 中獲取 YEAR 並在運行時創建一個文件夾。

如果您的日期在流水線開始之前已知,您可以執行此操作

year="2020"
metadata = (data_from_test |'CSVConversionMeta' >> beam.ParDo(WriteToCSVmeta())|'Writing To File' >> beam.io.WriteToText('gs://tester1212/CIK/{}/FILING/metadata.csv'.format(year)))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM