MySQL Vs MongoDB聚合性能

Question

我正在测试一些数据库到我的应用程序。 主要功能是数据聚合（类似于这里的人：数据聚合mongodb vs mysql ）。

我面临着同样的问题。 我已经创建了一个示例测试数据。 在mysql方面没有连接，它是一个innodb表。 这是一个1,600万行的数据集，我正在对整个表进行求和和计数，没有任何过滤器，所以我可以比较每个的聚合引擎的性能。 在这两种情况下，所有数据都适合内存。 在这两种情况下，都没有写入负载。

使用MySQL（5.5.34-0ubuntu0.12.04.1），我的结果总是在2.03和2.10秒左右。 使用MongoDB（2.4.8，linux 64bits），我得到的结果总是在4.1到4.3秒之间。

如果我对索引字段进行一些过滤，MySQL结果时间会下降到大约1.18和1.20（处理的行数下降到数据集的一半）。 如果我对MongoDB上的索引字段进行相同的过滤，结果时间仅下降到3.7秒左右（再次处理数据集的一半，我通过匹配条件的解释确认）。

我的结论是：1）我的文档设计非常糟糕（真的可以），或者2）MongoDB聚合框架真的不适合我的需要。

问题是：我可以做些什么（在特定的mongoDB配置，文档建模等方面）使Mongo的结果更快？ 这是MongoDB不适合的情况吗？

我的表和documento架构：

| events_normal |

CREATE TABLE `events_normal` (
  `origem` varchar(35) DEFAULT NULL,
  `destino` varchar(35) DEFAULT NULL,
  `qtd` int(11) DEFAULT NULL,
  KEY `idx_orides` (`origem`,`destino`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |

{
    "_id" : ObjectId("52adc3b444ae460f2b84c272"),
    "data" : {
        "origem" : "GRU",
        "destino" : "CGH",
        "qtdResultados" : 10
    }
}

提到的索引和过滤字段是“origem”和“destino”。

select sql_no_cache origem, destino, sum(qtd), count(1) from events_normal group by origem, destino;
select sql_no_cache origem, destino, sum(qtd), count(1) from events_normal where origem="GRU" group by origem, destino;

db.events.aggregate( {$group: {         _id: {origem: "$data.origem", destino: "$data.destino"},         total: {$sum: "$data.qtdResultados" },         qtd: {$sum: 1}     }  } )
db.events.aggregate( {$match: {"data.origem":"GRU" } } , {$group: {         _id: {origem: "$data.origem", destino: "$data.destino"},         total: {$sum: "$data.qtdResultados" },         qtd: {$sum: 1}     }  } )

谢谢！

Answer 1

聚合并不是MongoDB最初设计的，所以它并不是它最快的功能。

当你真的想使用MongoDB时，你可以使用分片，这样每个分片都可以处理它的聚合份额（确保以每个组只在一个簇上的方式选择分片键，否则你将实现相反的目的））。 然而，这不再是与MySQL的公平比较，因为MongoDB集群将使用更多的硬件。

MySQL Vs MongoDB聚合性能

问题描述

1 个解决方案

解决方案1
4 已采纳 2013-12-15 16:41:57

MySQL Vs MongoDB聚合性能

问题描述

1 个解决方案

解决方案1 4 已采纳 2013-12-15 16:41:57

解决方案1
4 已采纳 2013-12-15 16:41:57