[英]Adding NumpyArray Values in RDD Python from Dictionary
如何分別在 RDD 中添加字典中的值?
我有以下內容:
my_model = sc.parallelize([("Smith", np.array([1, 0, 3])), ("Johnson",np.array([2, 4, 1])), ("Brown",np.array([1, 1, 2]))])
我希望最終的 output 成為 numpy 數組中的以下內容:
[4, 5, 6]
如何在 numpy 數組中添加這個 output?
您可以使用reduce
function 添加 RDD 中的值:
from operator import add
result = my_model.map(lambda x: x[1]).reduce(add)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.