MySQL：与直接使用视图的底层 JOIN 的查询相比，为什么使用 VIEW 的查询效率较低？

Question

我有三个表， bug ， bugrule和bugtrace ，它们的关系是：

bug     1--------N  bugrule
        id = bugid

bugrule 0---------N bugtrace
        id = ruleid

因为我几乎总是对bug <---> bugtrace之间的关系感兴趣， bug <---> bugtrace我创建了一个适当的VIEW ，用作多个查询的一部分。 有趣的是，使用此VIEW查询比显式使用底层JOIN等效查询的性能要差得多。

VIEW定义：

CREATE VIEW bugtracev AS
  SELECT t.*, r.bugid
      FROM bugtrace AS t
      LEFT JOIN bugrule AS r ON t.ruleid=r.id
    WHERE r.version IS NULL

使用VIEW的查询的执行计划（性能不佳）：

mysql> explain 
      SELECT c.id,state,
             (SELECT COUNT(DISTINCT(t.id)) FROM bugtracev AS t 
               WHERE t.bugid=c.id) 
       FROM bug AS c 
      WHERE c.version IS NULL
        AND c.id<10;
+----+--------------------+-------+-------+---------------+--------+---------+-----------------+---------+-----------------------+
| id | select_type        | table | type  | possible_keys | key    | key_len | ref             | rows    | Extra                 |
+----+--------------------+-------+-------+---------------+--------+---------+-----------------+---------+-----------------------+
|  1 | PRIMARY            | c     | range | id_2,id       | id_2   | 8       | NULL            |       3 | Using index condition |
|  2 | DEPENDENT SUBQUERY | t     | index | NULL          | ruleid | 9       | NULL            | 1426004 | Using index           |
|  2 | DEPENDENT SUBQUERY | r     | ref   | id_2,id       | id_2   | 8       | bugapp.t.ruleid |       1 | Using where           |
+----+--------------------+-------+-------+---------------+--------+---------+-----------------+---------+-----------------------+
3 rows in set (0.00 sec)

直接使用底层JOIN的查询执行计划（性能好）：

mysql> explain 
       SELECT c.id,state,
              (SELECT COUNT(DISTINCT(t.id)) 
                 FROM bugtrace AS t
                 LEFT JOIN bugrule AS r ON t.ruleid=r.id 
                WHERE r.version IS NULL
                  AND r.bugid=c.id) 
        FROM bug AS c 
       WHERE c.version IS NULL
         AND c.id<10;
+----+--------------------+-------+-------+---------------+--------+---------+-------------+--------+-----------------------+
| id | select_type        | table | type  | possible_keys | key    | key_len | ref         | rows   | Extra                 |
+----+--------------------+-------+-------+---------------+--------+---------+-------------+--------+-----------------------+
|  1 | PRIMARY            | c     | range | id_2,id       | id_2   | 8       | NULL        |      3 | Using index condition |
|  2 | DEPENDENT SUBQUERY | r     | ref   | id_2,id,bugid | bugid  | 8       | bugapp.c.id |      1 | Using where           |
|  2 | DEPENDENT SUBQUERY | t     | ref   | ruleid        | ruleid | 9       | bugapp.r.id | 713002 | Using index           |
+----+--------------------+-------+-------+---------------+--------+---------+-------------+--------+-----------------------+
3 rows in set (0.00 sec)

CREATE TABLE语句（由不相关的列减少）是：

mysql> show create table bug;
CREATE TABLE `bug` (
  `id` bigint(20) NOT NULL,
  `version` int(11) DEFAULT NULL,
  `state` varchar(16) DEFAULT NULL,
  UNIQUE KEY `id_2` (`id`,`version`),
  KEY `id` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

mysql> show create table bugrule;
CREATE TABLE `bugrule` (
  `id` bigint(20) NOT NULL,
  `version` int(11) DEFAULT NULL,
  `bugid` bigint(20) NOT NULL,
  UNIQUE KEY `id_2` (`id`,`version`),
  KEY `id` (`id`),
  KEY `bugid` (`bugid`),
  CONSTRAINT `bugrule_ibfk_1` FOREIGN KEY (`bugid`) REFERENCES `bug` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

mysql> show create table bugtrace;
CREATE TABLE `bugtrace` (
  `id` bigint(20) NOT NULL,
  `ruleid` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `ruleid` (`ruleid`),
  CONSTRAINT `bugtrace_ibfk_1` FOREIGN KEY (`ruleid`) REFERENCES `bugrule` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

Answer 1

您会问为什么要对具有COUNT(DISTINCT val)和相关子查询的几个复杂查询进行查询优化。 很难确定为什么。

不过，您可能会通过摆脱依赖子查询来解决大部分性能问题。 尝试这样的事情：

 SELECT c.id,state, cnt.cnt
   FROM bug AS c
   LEFT JOIN (
            SELECT bugid, COUNT(DISTINCT id) cnt
              FROM bugtracev 
             GROUP BY bugid
        ) cnt ON c.id = cnt.bugid
  WHERE c.version IS NULL
    AND c.id<10;

为什么这有帮助？ 为了满足查询，优化器可以选择只运行一次GROUP BY子查询，而不是多次。 而且，您可以在GROUP BY子查询上使用EXPLAIN来了解其性能。

您还可以通过在bugrule上创建与视图中的查询匹配的复合索引来提高性能。 试试这个。

 CREATE INDEX bugrule_v ON bugrule (version, ruleid, bugid)

并尝试像这样切换最后两列

 CREATE INDEX bugrule_v ON bugrule (version, ruleid, bugid)

这些索引称为覆盖索引，因为它们包含满足查询所需的所有列。 version首先出现，因为这有助于优化视图定义中的WHERE version IS NULL 。 这使它更快。

专业提示：避免在视图和查询中使用SELECT * ，尤其是当您遇到性能问题时。 相反，列出您实际需要的列。 *可能会强制查询优化器避免覆盖索引，即使索引会有所帮助。

Answer 2

使用 MySQL 5.6（或更早版本）时，请尝试至少使用 MySQL 5.7。 根据MySQL 5.7 中的新增功能？ ：

我们必须在很大程度上统一对派生表和视图的处理。 到目前为止，FROM 子句（派生表）中的子查询是无条件物化的，而从相同查询表达式创建的视图有时会被物化，有时会合并到外部查询中。 这种行为除了不一致之外，还会导致严重的性能损失。

MySQL：与直接使用视图的底层 JOIN 的查询相比，为什么使用 VIEW 的查询效率较低？

问题描述

2 个解决方案

解决方案1
1 已采纳 2019-11-30 15:43:53

解决方案2
0 2019-11-30 17:34:50

MySQL：与直接使用视图的底层 JOIN 的查询相比，为什么使用 VIEW 的查询效率较低？

问题描述

2 个解决方案

解决方案1 1 已采纳 2019-11-30 15:43:53

解决方案2 0 2019-11-30 17:34:50

解决方案1
1 已采纳 2019-11-30 15:43:53

解决方案2
0 2019-11-30 17:34:50