[英]Map Reduce with HIVE
我有4个CSV文件形式的4个不同的数据集,其中的公共字段是ID。 我必须使用Join实现。 为了实施更好的Map Reduce或HIVE这个概念,是否有可能结合Map Reduce和HIVE
非常感谢 。
在大多数情况下,与Hive
相比,大多数时候Map Reduce
都会提供更好的性能和控制力。 必须在更好地理解用例的情况下编写代码。
是的,可以将Map Reduce
和Hive
结合使用。
Hive将Hive查询转换为一系列MapReduce作业,以模拟查询的行为。 尽管Hive非常有用,但将您的业务逻辑表示为Hive查询并不总是有效的。
如果您对性能有延迟,并希望加入大量数据 ,那么可以选择HIVE。
如果您的数据集很小,您仍然可以使用Map Reduce Joins或Distributed Cache 。
看一下“ Map Reduce Joins”文章。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.