繁体   English   中英

Azure Data Lake Store并发

[英]Azure Data Lake Store concurrency

我一直在玩Azure Data Lake Store,在文档中,Microsoft声称该系统针对文件的低延迟小写入进行了优化。 测试它我尝试对单个文件执行大量的并行任务写入,但是这种方法在大多数情况下都会失败,返回错误的请求。 此链接https://issues.apache.org/jira/secure/attachment/12445209/appendDesign3.pdf显示HDFS不是为了处理单个文件上的并发附加,所以我尝试第二次使用找到的ConcurrentAppendAsync方法在API中,虽然方法没有崩溃,但我的文件从未在商店中修改过。

你发现的是关于并行写入如何工作的正确性。 我假设您已经阅读了ConcurrentAppendAsync的文档

那么,在您的情况下,您是否使用相同的文件进行Webhdfs写入测试和ConcurrentAppendAsync? 如果是这种情况,那么ConcurrentAppendAsync将不起作用,如文档中所述。 但在这种情况下你应该有一个错误。

无论如何,让我们知道发生了什么,我们可以进一步调查。

谢谢,

萨钦谢思

程序经理 - Azure Data Lake

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM