繁体   English   中英

HDInsight-Azure Blob存储

[英]HDInsight - Azure blob storage

我对azure hdInsight有一些基本的说明。 以下文章提供了有关使用hdinsight的一些基本信息。 https://azure.microsoft.com/zh-CN/documentation/articles/hdinsight-hadoop-emulator-get-started/

它说HDinsight在内部使用了Azure Blob存储。 考虑到这一点,我的问题如下:

我有一个使用存储帐户stg1的hdinsight hd1。 如果我只想使用azure Storage Explorer将文件上传和下载到stg1,那么拥有hd1的用途是什么,我什至无需创建成本高昂的hdinsight就可以做到。 那么,hadoop hdinsight是否仅用于处理存储在stg1中的某些数据以产生诸如wordcount之类的结果?这是我们使用HDInsight的唯一原因吗?

如果您想更好地了解HDInsight和Blob存储,则需要阅读https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-use-blob-storage/

HDInsight是Microsoft的Hadoop实现。 到目前为止,共有4种不同的基本类型,包括Hadoop,HBase,Storm,Spark。 您始终可以将其他组件安装到基本类型。

您的问题确实是关于为什么要使用Hadoop的问题。 当您需要处理大量数据(大数据)时,Hadoop会大放异彩。

HDInsight与其他Hadoop实施之间的区别之一是存储(blob存储)与计算(HDInsight群集)的分离。 您仍然需要复制数据(或将数据直接存储在Azure blob存储中)。 准备好处理时,可以创建HDInsight群集,提交作业,然后删除该群集。 您删除了集群,因此不再需要为集群付费。 即使删除群集后,您在Blob存储中存储的日期也会保留。

HDInsight是产品,包括家庭 的Hadoop星火HBase的 ,和风暴 它们都做不同的事情,而存储只是一个方面。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM