[英]Optimize a query
如何继续使响应时间更快,大约平均响应时间为0.2秒(我的项目表中有8039条记录,跟踪表中有81条记录)
询问
SELECT a.name, b.cnt FROM `items` a LEFT JOIN
(SELECT guid, COUNT(*) cnt FROM tracking WHERE
date > UNIX_TIMESTAMP(NOW() - INTERVAL 1 day ) GROUP BY guid) b ON
a.`id` = b.guid WHERE a.`type` = 'streaming' AND a.`state` = 1
ORDER BY b.cnt DESC LIMIT 15 OFFSET 75
跟踪表结构
CREATE TABLE `tracking` (
`id` bigint(11) NOT NULL AUTO_INCREMENT,
`guid` int(11) DEFAULT NULL,
`ip` int(11) NOT NULL,
`date` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `i1` (`ip`,`guid`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4303 DEFAULT CHARSET=latin1;
项目表结构
CREATE TABLE `items` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`guid` int(11) DEFAULT NULL,
`type` varchar(255) DEFAULT NULL,
`name` varchar(255) DEFAULT NULL,
`embed` varchar(255) DEFAULT NULL,
`url` varchar(255) DEFAULT NULL,
`description` text,
`tags` varchar(255) DEFAULT NULL,
`date` int(11) DEFAULT NULL,
`vote_val_total` float DEFAULT '0',
`vote_total` float(11,0) DEFAULT '0',
`rate` float DEFAULT '0',
`icon` text CHARACTER SET ascii,
`state` int(11) DEFAULT '0',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=9258 DEFAULT CHARSET=latin1;
按照您的书面查询,没有多大意义。 它会在您的两个表中产生所有可能的行组合,然后对其进行分组。
您可能想要这样:
SELECT a.*, b.cnt
FROM `items` a
LEFT JOIN (
SELECT guid, COUNT(*) cnt
FROM tracking
WHERE `date` > UNIX_TIMESTAMP(NOW() - INTERVAL 1 day)
GROUP BY guid
) b ON a.guid = b.guid
ORDER BY b.cnt DESC
此查询中的大量数据来自相对较大的跟踪表。 因此,您应该使用列(date, guid)
向其添加复合索引。 这将允许您的查询按date
随机访问索引,然后扫描其guid
值。
ALTER TABLE tracking ADD INDEX guid_summary (`date`, guid);
我想您会看到不错的性能改进。
专家提示:不要使用SELECT *
。 而是提供结果集中所需的列的列表。 例如,
SELECT a.guid, a.name, a.description, b.cnt
为什么这很重要?
首先,它使您的软件更具抵御能力,以防将来有人向表中添加列。
其次,它告诉MySQL服务器仅传递所需的信息。 这可以极大地提高性能,尤其是当您的桌子很大时。
由于tracking
的行数明显少于items
,因此我将提出以下建议。
SELECT i.name, c.cnt
FROM
(
SELECT guid, COUNT(*) cnt
FROM tracking
WHERE date > UNIX_TIMESTAMP(NOW() - INTERVAL 1 day )
GROUP BY guid
) AS c
JOIN items AS i ON i.id = c.guid
WHERE i.type = 'streaming'
AND i.state = 1;
ORDER BY c.cnt DESC
LIMIT 15 OFFSET 75
它将无法显示cnt
为0的任何项目。(您的版本显示计数为NULL
的项目。)
需要的综合索引:
items: The PRIMARY KEY(id) is sufficient.
tracking: INDEX(date, guid) -- "covering"
其他事宜:
ip
是IP地址,则必须为INT UNSIGNED
。 但这仅涵盖IPv4,而不涵盖IPv6。 date
不仅仅是一个“日期”,而且实际上是一个日期+时间。 请重命名以避免混淆。 float(11,0)
-请勿对整数使用FLOAT
。 不要在FLOAT
或DOUBLE
上使用(m,n)
。 INT UNSIGNED
在这里更有意义。 就性能而言, OFFSET
是顽皮的-它必须扫描跳过的记录。 但是,在您的查询中,无法避免收集所有可能的行,对其进行排序,超过75行,最后只能交付15行。 (而且,总数不超过81,则不会是完整的15。)
您使用什么版本? 对LEFT JOIN ( SELECT ... )
的优化进行了重要更改。 请为讨论中的每个查询提供EXPLAIN SELECT
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.