优化查询

Question

如何继续使响应时间更快，大约平均响应时间为0.2秒（我的项目表中有8039条记录，跟踪表中有81条记录）

询问

 SELECT a.name, b.cnt  FROM `items` a  LEFT JOIN 
(SELECT guid, COUNT(*) cnt FROM tracking WHERE
date > UNIX_TIMESTAMP(NOW() - INTERVAL 1 day ) GROUP BY guid)  b ON
a.`id` = b.guid WHERE a.`type` = 'streaming' AND a.`state` = 1 
ORDER BY b.cnt DESC LIMIT 15 OFFSET 75

跟踪表结构

CREATE TABLE `tracking` (
`id` bigint(11) NOT NULL AUTO_INCREMENT,
`guid` int(11) DEFAULT NULL,
`ip` int(11) NOT NULL,
`date` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `i1` (`ip`,`guid`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4303 DEFAULT CHARSET=latin1;

项目表结构

CREATE TABLE `items` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`guid` int(11) DEFAULT NULL,
`type` varchar(255) DEFAULT NULL,
`name` varchar(255) DEFAULT NULL,
`embed` varchar(255) DEFAULT NULL,
`url` varchar(255) DEFAULT NULL,
`description` text,
`tags` varchar(255) DEFAULT NULL,
`date` int(11) DEFAULT NULL,
`vote_val_total` float DEFAULT '0',
`vote_total` float(11,0) DEFAULT '0',
`rate` float DEFAULT '0',
`icon` text CHARACTER SET ascii,
`state` int(11) DEFAULT '0',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=9258 DEFAULT CHARSET=latin1;

Answer 1

按照您的书面查询，没有多大意义。 它会在您的两个表中产生所有可能的行组合，然后对其进行分组。

您可能想要这样：

    SELECT a.*, b.cnt 
      FROM `items` a  
 LEFT JOIN (
              SELECT guid, COUNT(*) cnt 
                FROM tracking 
               WHERE `date` > UNIX_TIMESTAMP(NOW() - INTERVAL 1 day) 
            GROUP BY guid
           )  b ON a.guid = b.guid
  ORDER BY b.cnt DESC

此查询中的大量数据来自相对较大的跟踪表。 因此，您应该使用列(date, guid)向其添加复合索引。 这将允许您的查询按date随机访问索引，然后扫描其guid值。

 ALTER TABLE tracking ADD INDEX guid_summary (`date`, guid);

我想您会看到不错的性能改进。

专家提示：不要使用SELECT * 。 而是提供结果集中所需的列的列表。 例如，

SELECT a.guid, a.name, a.description, b.cnt

为什么这很重要？

首先，它使您的软件更具抵御能力，以防将来有人向表中添加列。

其次，它告诉MySQL服务器仅传递所需的信息。 这可以极大地提高性能，尤其是当您的桌子很大时。

Answer 2

由于tracking的行数明显少于items ，因此我将提出以下建议。

SELECT  i.name, c.cnt
    FROM  
    (
        SELECT  guid, COUNT(*) cnt
            FROM  tracking
            WHERE  date > UNIX_TIMESTAMP(NOW() - INTERVAL 1 day )
            GROUP BY  guid 
    ) AS c
    JOIN  items AS i  ON i.id = c.guid
    WHERE  i.type = 'streaming'
      AND  i.state = 1;
    ORDER BY  c.cnt DESC
    LIMIT  15 OFFSET 75

它将无法显示cnt为0的任何项目。（您的版本显示计数为NULL的项目。）

需要的综合索引：

items: The PRIMARY KEY(id) is sufficient.
tracking: INDEX(date, guid) -- "covering"

其他事宜：

如果ip是IP地址，则必须为INT UNSIGNED 。 但这仅涵盖IPv4，而不涵盖IPv6。
看来date不仅仅是一个“日期”，而且实际上是一个日期+时间。 请重命名以避免混淆。
float(11,0) -请勿对整数使用FLOAT 。 不要在FLOAT或DOUBLE上使用(m,n) 。 INT UNSIGNED在这里更有意义。

就性能而言， OFFSET是顽皮的-它必须扫描跳过的记录。 但是，在您的查询中，无法避免收集所有可能的行，对其进行排序，超过75行，最后只能交付15行。 （而且，总数不超过81，则不会是完整的15。）

您使用什么版本？ 对LEFT JOIN ( SELECT ... )的优化进行了重要更改。 请为讨论中的每个查询提供EXPLAIN SELECT 。

优化查询

问题描述

2 个解决方案

解决方案1
2 已采纳 2017-02-09 19:06:44

解决方案2
0 2017-02-10 06:45:23

优化查询

问题描述

2 个解决方案

解决方案1 2 已采纳 2017-02-09 19:06:44

解决方案2 0 2017-02-10 06:45:23

解决方案1
2 已采纳 2017-02-09 19:06:44

解决方案2
0 2017-02-10 06:45:23