MySQL：如何通过2个联接和1个子查询提高选择查询的速度

Question

在表“ ttraces”中，我有许多记录用于不同的任务（其值保存在“ taskid”列中，并且是表“ ttasks”中列“ id”的外键）。 每个任务每8-10秒就会在“ ttraces”中插入一条记录，因此缓存数据以提高性能并不是一个好主意。 我需要的是从“ ttraces”中仅选择每个任务的最新记录，这意味着记录中“ time”列的最大值。 目前，表中有超过500000条记录。 这两个表的非常简化的结构如下所示：

-----------------------
|       ttasks        |
-----------------------
| id | name | blocked |
-----------------------

---------------------
|      ttraces       |
---------------------
| id | taskid | time |
---------------------

我的查询如下所示：

SELECT t.name,tr.time
FROM 
    ttraces tr 
    JOIN 
    ttasks t ON tr.itask = t.id 
    JOIN (
        SELECT taskid, MAX(time) AS max_time
        FROM ttraces 
        GROUP BY itask
    ) x ON tr.taskid = x.taskid AND tr.time = x.max_time
WHERE t.blocked

WHERE和JOIN子句中使用的所有列均已建立索引。 目前，查询运行了大约1.5秒。 加快速度至关重要。 感谢您的所有建议。 顺便说一句：该数据库正在托管的共享服务器上运行，目前我无法将其移动到其他任何地方。

[编辑]解释选择...结果是：

--------------------------------------------------------------------------------------------------------------
id   select_type   table        type     possible_keys   key       key_len   ref          rows     Extra
--------------------------------------------------------------------------------------------------------------
1   PRIMARY        <derived2>   ALL      NULL            NULL      NULL      NULL         74   
1   PRIMARY        t            eq_ref   PRIMARY         PRIMARY   4         x.taskid     1        Using where
1   PRIMARY        tr           ref      taskid,time     time      9         x.max_time   1        Using where
2   DERIVED        ttraces      index    NULL            itask     5         NULL         570853   
--------------------------------------------------------------------------------------------------------------

引擎是InnoDB。

Answer 1

我可能需要一点时间，但是此查询在逻辑上是不一样的，并且（几乎可以肯定）更快吗？

SELECT t.id, t.name,max(tr.time)
FROM 
ttraces tr 
JOIN 
ttasks t ON tr.itask = t.id 
where BLOCKED
group by t.id, t.name

Answer 2

如果每个任务有很多跟踪，那么您可以保留仅包含最新跟踪的表。 每当您插入到ttrace中时，您也会向上插入ttraces_newest：

insert into ttraces_newest (id, taskid, time) values
(3, 1, '2012-01-01 08:02:01')
on duplicate key update
`time` = current_timestamp

ttraces_newest的主键是（id，taskid）。 查询ttraces_newest会更便宜。 便宜多少取决于每个任务有多少条痕迹。 现在查询是：

SELECT t.name,tr.time
FROM 
    ttraces_newest tr 
    JOIN 
    ttasks t ON tr.itask = t.id 
WHERE t.blocked

Answer 3

这是我的主意...您需要在ttraces有一个复合索引， ttraces具有taskid和time列（ ttraces顺序）。 比使用以下查询：

SELECT t.name,
       trm.mtime
FROM   ttasks AS t
       JOIN (SELECT taskid,
                    Max(time) AS mtime
             FROM   ttraces
             GROUP  BY taskid) AS trm
         ON t.id = trm.taskid
WHERE  t.blocked

Answer 4

此代码返回正确的结果吗？ 如果是这样，它的速度如何？

SELECT t.name, max_time 
FROM ttasks t JOIN ( 
    SELECT taskid, MAX(time) AS max_time 
    FROM ttraces  
    GROUP BY taskid
) x ON t.id = x.taskid

MySQL：如何通过2个联接和1个子查询提高选择查询的速度

问题描述

4 个解决方案

解决方案1
1 2012-09-26 12:32:22

解决方案2
0 2012-09-26 11:24:08

解决方案3
0 2012-09-26 11:31:35

解决方案4
0 2012-09-26 11:33:05

MySQL：如何通过2个联接和1个子查询提高选择查询的速度

问题描述

4 个解决方案

解决方案1 1 2012-09-26 12:32:22

解决方案2 0 2012-09-26 11:24:08

解决方案3 0 2012-09-26 11:31:35

解决方案4 0 2012-09-26 11:33:05

解决方案1
1 2012-09-26 12:32:22

解决方案2
0 2012-09-26 11:24:08

解决方案3
0 2012-09-26 11:31:35

解决方案4
0 2012-09-26 11:33:05