![](/img/trans.png)
[英]What are the differences between Dataframe, Dataset, and RDD in Apache Spark?
[英]What is the differences between Apache Spark and Apache Apex?
Apache Apex - 是一個開源的企業級統一流和批處理平台。 它在GE Predix平台中用於物聯網。 這兩個平台之間的主要區別是什么?
問題
將它與Spark進行比較:Apache Spark實際上是一個批處理。 如果你考慮Spark流(它使用下面的spark),那么它就是微批處理。 相比之下,Apache apex是一個真正的流處理。 從某種意義上說,傳入記錄不必等待下一個記錄進行處理。 記錄一經處理即被處理並發送到下一級處理。
目前,正在努力增加對Apache Apex與Apache Samoa,H2O等機器學習庫集成的支持。請參閱https://issues.apache.org/jira/browse/SAMOA-49
目前,它支持Java,Scala。
https://www.datatorrent.com/blog/blog-writing-apache-apex-application-in-scala/對於Python,您可以使用Jython進行嘗試。 但是,我自己並沒有嘗試過。 所以,不太確定。
考慮到它們是兩種不同的處理引擎,與Spark集成可能不是一個好主意。 但是,Apache apex與機器學習庫的集成正在進行中。
如果您有任何其他問題,可以在apache apex用戶的郵件列表中發布功能請求: https : //mail-archives.apache.org/mod_mbox/incubator-apex-users/
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.