簡體   English   中英

Apache beam write轉換寫入多個文件?

[英]Apache beam write transform writes into multiple files?

我正在查看Apache Beam中的wordCount示例,當我嘗試在本地運行此示例時,它將計數寫入多個文件。 我創建了一個測試項目來讀取和寫入文件中的數據,甚至寫操作也將輸出寫入多個文件。 如何只在一個文件中獲得結果? 我正在使用直接跑步者

出於性能原因,這種情況正在發生。 您應該能夠使用TextIO.Write.withoutSharding強制單個文件

withoutSharding

public TextIO.Write withoutSharding()

強制將單個文件作為輸出和空分片名稱模板。 此選項僅與未停止的寫入兼容。

對於未窗口的寫入,限制分片數量可能會降低管道的性能。 除非您需要特定數量的輸出文件,否則不建議設置此值。

這相當於.withNumShards(1).withShardNameTemplate(“”)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM