[英]How to make mysql slower on running query than hadoop?
我想问一个奇怪的问题。 我有一个hadoop项目,我想比较hadoop和mysql的时间性能。 我已经做了hadoop应用程序来计数一些东西。 如果转换为SQL,该应用程序将成为COUNT查询,并带有一些表。
首先,我尝试在SQL上记录约100.000的小表,它查询约0.3或0.4秒。 因此,我想复制并扩大具有更多记录的表,以查找hadoop的功能,而不是mysql。 与重复的数据一样,我可以使hadoop大于mysql吗? 或者我还能做些什么来证明hadoop的时间性能比mysql好?
为了获得比mysql更好的性能,您的数据大小应该非常大。 例如,如果您的数据为1GB。 您将并行运行16个Mappers。 如果数据小于64 MB,则将使用一个Mapper,在这种情况下您不会看到性能提升。 因此,请确保您的数据足够大以测试性能。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.