使用GROUP BY优化查询以删除“使用临时”；使用文件排序

Question

我正在使用mySQL 5.6.13.2，并有一个查询，该查询涉及父表中的150,000行和子表中的1M以上的行。 如果我删除GROUP BY（仅作为测试），查询将花费2秒，如果我拥有GROUP BY，则查询将花费6秒以上。

我读过其他有关如何使用临时删除的文章。 使用文件排序，但是这些不能解决问题。 我希望在这里能得到一些帮助。

可以在此处找到展示所有这些的SQL提琴： http : //sqlfiddle.com/#!9/edeb6/1

CREATE TABLE `summary` (
   `RunID` int(10) unsigned NOT NULL AUTO_INCREMENT,
   `LastUpdate` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
   `FileName` varchar(50) COLLATE utf8_unicode_ci DEFAULT NULL,
   `XCount` int(11) DEFAULT NULL,
   `YCount` int(11) DEFAULT NULL,
   `AccountID` varchar(25) COLLATE utf8_unicode_ci DEFAULT NULL,
   PRIMARY KEY (`RunID`),
   KEY `acct-lastupdate` (`AccountID`,`LastUpdate`),
   KEY `acct-lastupdate-counts` (`AccountID`,`LastUpdate`,`XCount`,`YCount`)
   ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;



CREATE TABLE `detail` (
  `DetailID` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `LastUpdate` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  `RunID` int(10) unsigned DEFAULT NULL,
  `TestID` varchar(80) COLLATE utf8_unicode_ci DEFAULT NULL,
  `ResultCode` int(11) DEFAULT NULL,
   PRIMARY KEY (`DetailID`),
  KEY `detail_runid` (`RunID`),
  KEY `detail_testid` (`TestID`),
  KEY `detail_runid_testid_result` (`RunID`,`TestID`,`ResultCode`)
  ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

这是我的查询的EXPLAIN输出：

EXPLAIN select
      testid as 'TestID',
      sum(case when resultcode = 1 then 1 else 0 end) as Category1,
      sum(case when resultcode = 2 then 1 else 0 end) as Category2,
      sum(case when resultcode = 0 then 1 else 0 end) as Category3
      from detail d, summary s
      where s.accountid = 'xyz'
        and s.lastupdate >= '2014-05-26 00:00:00'
        and s.lastupdate < '2014-07-27 00:00:00'
        and s.runid = d.runid
        and s.runid <= 9999999999
      GROUP BY testid;

 1  SIMPLE  s   ref PRIMARY,acct-lastupdate,acct-lastupdate-counts  acct-lastupdate 78  const   2   Using where; Using index; Using temporary; Using filesort
 1  SIMPLE  d   ref detail_runid,detail_runid_testid_result detail_runid    5   db_9_edeb6.s.RunID  1   (null)

如果我删除GROUP BY，则说明说“在哪里使用”； 使用没有临时或文件排序的索引，查询将在2秒而不是6秒内运行。

必须将这些结果按测试ID分组。 而且，测试ID值是任意的，并且事先未知，因此将无法用带有针对硬编码的已知测试ID的子查询来编写查询。

是否可以定义其他索引来停止临时和文件排序？ 如果不是，是否有更富创造性的方式来重写此查询，从而提高效率并可能解决该问题？

请注意，在我的查询的GROUP BY确实具有一些HAVING和ORDER BY条件之后（具体来说，它会... GROUP BY testid具有Category1 OR Category2 OR Category3按Category1 desc，Category 2 desc的顺序；“-但是，我在示例中省略了它在这里，因为无论使用或不使用扩展子句，我都能获得相同的性能和EXPLAIN输出，并且我想使示例尽可能简单。我在这里提到它是因为如果您有一种创造性的方式来重写查询（如果可以的话），请这将是很好的。

如前所述，这里有一个SQL提琴http://sqlfiddle.com/#!9/edeb6/1演示了此问题（因此您可以看到EXPLAIN输出和实验）。

谢谢！

Answer 1

如果可以选择，请尝试将“ accountid”字段添加到“ detail”表中。 然后，您无需加入此查询的摘要表。 从查询中删除“摘要”表，并将“ s”别名指向“ d”。 然后EXPLAIN仅使用where显示。 但我不知道它是否比您的速度快得多。

语句“ sum（case，结果代码= 1，然后1，否则0，结束）”可以这样写：“ sum（resultcode = 1）作为Category1，sum（reusltcode = 2）作为Category2 ...”

使用GROUP BY优化查询以删除“使用临时”；使用文件排序

问题描述

1 个解决方案

解决方案1
0 2014-07-30 18:54:50

使用GROUP BY优化查询以删除“使用临时”； 使用文件排序

问题描述

1 个解决方案

解决方案1 0 2014-07-30 18:54:50

使用GROUP BY优化查询以删除“使用临时”；使用文件排序

解决方案1
0 2014-07-30 18:54:50