簡體   English   中英

Azure Data Lake Store並發

[英]Azure Data Lake Store concurrency

我一直在玩Azure Data Lake Store,在文檔中,Microsoft聲稱該系統針對文件的低延遲小寫入進行了優化。 測試它我嘗試對單個文件執行大量的並行任務寫入,但是這種方法在大多數情況下都會失敗,返回錯誤的請求。 此鏈接https://issues.apache.org/jira/secure/attachment/12445209/appendDesign3.pdf顯示HDFS不是為了處理單個文件上的並發附加,所以我嘗試第二次使用找到的ConcurrentAppendAsync方法在API中,雖然方法沒有崩潰,但我的文件從未在商店中修改過。

你發現的是關於並行寫入如何工作的正確性。 我假設您已經閱讀了ConcurrentAppendAsync的文檔

那么,在您的情況下,您是否使用相同的文件進行Webhdfs寫入測試和ConcurrentAppendAsync? 如果是這種情況,那么ConcurrentAppendAsync將不起作用,如文檔中所述。 但在這種情況下你應該有一個錯誤。

無論如何,讓我們知道發生了什么,我們可以進一步調查。

謝謝,

薩欽謝思

程序經理 - Azure Data Lake

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM