[英]How to Write the data into Google MemoryStore(Redis) using Apache Beam with DataFlowRunner
[英]How to write files to google bucket using Apache Beam dynamically?
我正在嘗試使用 Apache Beam 將一些文件寫入 google 存儲桶,但文件位置和文件夾名稱是從文件中的第一個索引生成的,那么如何創建此字典並將我的文件寫入其中?
metadata = (data_from_test |'CSVConversionMeta' >> beam.ParDo(WriteToCSVmeta())|'Writing To File' >> beam.io.WriteToText('gs://tester1212/CIK/YEAR/FILING/metadata.csv'))
所以,這是我編寫文件的代碼,但我希望從 csv 中獲取 YEAR 並在運行時創建一個文件夾。
如果您的日期在流水線開始之前已知,您可以執行此操作
year="2020"
metadata = (data_from_test |'CSVConversionMeta' >> beam.ParDo(WriteToCSVmeta())|'Writing To File' >> beam.io.WriteToText('gs://tester1212/CIK/{}/FILING/metadata.csv'.format(year)))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.