[英]DAG creation in Apache Spark
在Apache Spark中,我知道當我使用某些轉換函數時,所有函數都存儲為DAG,並且當我調用動作時,Spark會運行從該DAG到Action函數的所有必需轉換函數。 所以,假設我有
因此,我的問題是在步驟2調用第一個操作之后,是否刪除了dag,並在調用第二個操作時從步驟3創建了新的DAG,還是從步驟1創建了新的DAG?
Spark使用彈性分布式數據集(RDD),該數據集代表數據的集合。 Spark可以將其存儲在分布式內存中。 如您所述,RDD是內置在DAG中的。
在您的情況下:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.