繁体   English   中英

从hadoop HDFS数据中搜索

[英]Search from hadoop hdfs data

我从JSON格式的在线源中提取数据,并通过Apache Flume将其存储到Hdfs中。 现在,它像Hadoop一样创建多个文件。 现在,我想从此数据(从所有这些文件)中搜索内容,并获取与之相关的完整信息。 解决办法是什么?

您可以开发自己的脚本以使用MapReduce或Spark在hdfs中进行搜索。 您还有另一个解决方案,可以使用蜂巢和或Pig。 Pigg指南: http : //archive.cloudera.com/cdh/3/pig/tutorial.html蜂巢指南: https : //cwiki.apache.org/confluence/display/Hive/LanguageManual

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM