簡體 English 中英

什么是數據流中的python zip函數的等價物？

[英]what's the equivalent of the python zip function in dataflow?

原文 2016-10-27 10:38:51 2 1 python/ google-cloud-dataflow

我正在使用python apache_beam版本的數據流。 我有大約300個文件，每個文件包含400萬個條目。 整件事大約是5Gb，存放在一個gs桶上。

我可以通過讀取每個文件輕松生成數組{x_1, ... x_n}的PCollection，但我現在需要執行的操作就像python zip函數：我想要一個范圍從0到n-1的PCollection，其中每個元素i包含文件中所有x_i的數組。我試圖yield ING (i, element)的每一個元素，然后運行GroupByKey，但這是太緩慢，效率低下（它不會因為內存限制運行在所有本地，並花了24小時的雲，而我我確定如果需要，我至少可以加載所有數據集。

我如何重組管道以干凈利落地完成這項工作？

1 個解決方案

正如jkff在上面的注釋中指出的那樣，代碼確實是正確的，並且該過程是編程張量流算法的推薦方法。 應用於每個元素的DoFn是瓶頸。

什么是python的zip（*）的numpy等價物？

[英]What's the numpy equivalent of python's zip(*)?

Python numpy 中的“zip()”等價物是什么？

[英]What is the equivalent of "zip()" in Python's numpy?

什么是Python的“zip”內置的Ruby等價物？

[英]What is a Ruby equivalent for Python's “zip” builtin?

Z8F6823ABD383A2BBBB1F0D78EF3Z8 中的 Python zip function 的等效項是什么？

[英]What is the equivalent of the Python zip function in MATLAB?

Javascript 等效於 Python 的 zip 函數

[英]Javascript equivalent of Python's zip function

什么是Batch的PAUSE函數的Python等效項

[英]What is the Python Equivalent of Batch's PAUSE function

Python中R的function“復制”的等價物是什么？

[英]What is the equivalent of R's function “replicate” in Python?

什么是 Python 相當於 R 的 bkde function

[英]What is the Python equivalent to R's bkde function

什么是Java相當於Python的reduce函數？

[英]What is the Java equivalent to Python's reduce function?

什么是Python相當於C的讀取功能？

[英]What's Python's equivalent to C's read function?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 什么是python的zip（*）的numpy等價物？ Python numpy 中的“zip()”等價物是什么？什么是Python的“zip”內置的Ruby等價物？ Z8F6823ABD383A2BBBB1F0D78EF3Z8 中的 Python zip function 的等效項是什么？ Javascript 等效於 Python 的 zip 函數什么是Batch的PAUSE函數的Python等效項 Python中R的function“復制”的等價物是什么？什么是 Python 相當於 R 的 bkde function 什么是Java相當於Python的reduce函數？什么是Python相當於C的讀取功能？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM