[英]MySQL left outer join is slow
希望能得到一些關於這個查詢的幫助,我已經在它上面工作了一段時間並且無法更快地得到它:
SELECT date, count(id) as 'visits' FROM dates
LEFT OUTER JOIN visits
ON (dates.date = DATE(visits.start) and account_id = 40 )
WHERE date >= '2010-12-13' AND date <= '2011-1-13'
GROUP BY date ORDER BY date ASC
該查詢大約需要8秒才能運行。 我在dates.date,visits.start,visits.account_id和visits.start + visits.account_id上添加了索引,無法讓它更快地運行。
表結構(僅顯示訪問表中的相關列):
create table visits (
`id` int(11) NOT NULL AUTO_INCREMENT,
`account_id` int(11) NOT NULL,
`start` DATETIME NOT NULL,
`end` DATETIME NULL,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
CREATE TABLE `dates` (
`date` date NOT NULL,
PRIMARY KEY (`date`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;
日期表包含2010-1-1至2020-1-1(~3k行)的所有日期。 訪問表包含從2010年6月1日到昨天的約400k行。 我正在使用日期表,因此連接將返回0次訪問,沒有訪問。
結果我想參考:
+------------+--------+
| date | visits |
+------------+--------+
| 2010-12-13 | 301 |
| 2010-12-14 | 356 |
| 2010-12-15 | 423 |
| 2010-12-16 | 332 |
| 2010-12-17 | 346 |
| 2010-12-18 | 226 |
| 2010-12-19 | 213 |
| 2010-12-20 | 311 |
| 2010-12-21 | 273 |
| 2010-12-22 | 286 |
| 2010-12-23 | 241 |
| 2010-12-24 | 149 |
| 2010-12-25 | 102 |
| 2010-12-26 | 174 |
| 2010-12-27 | 258 |
| 2010-12-28 | 348 |
| 2010-12-29 | 392 |
| 2010-12-30 | 395 |
| 2010-12-31 | 278 |
| 2011-01-01 | 241 |
| 2011-01-02 | 295 |
| 2011-01-03 | 369 |
| 2011-01-04 | 438 |
| 2011-01-05 | 393 |
| 2011-01-06 | 368 |
| 2011-01-07 | 435 |
| 2011-01-08 | 313 |
| 2011-01-09 | 250 |
| 2011-01-10 | 345 |
| 2011-01-11 | 387 |
| 2011-01-12 | 0 |
| 2011-01-13 | 0 |
+------------+--------+
在此先感謝您的幫助!
你的問題在這里:
ON (dates.date = DATE(visits.start) and account_id = 40 )
因為您在visits.start
上使用DATE
函數, visits.start
MySQL無法使用索引進行連接。
可能最好的解決方案是將start_date
和end_date
列添加到dates
表並索引這些列。 因此,對於日期為2011-01-01的行,開始日期為2011-01-01 00:00:00,結束日期為2011-01-01 23:59:59。
然后您可以直接加入日期表,如下所示:
SELECT date, count(id) as 'visits' FROM dates
LEFT OUTER JOIN visits
ON (visits.start BETWEEN dates.start_date AND dates.end_date and account_id = 40 )
WHERE date >= '2010-12-13' AND date <= '2011-1-13'
GROUP BY date ORDER BY date ASC
另一種選擇是在訪問表上單獨存儲日期和時間部分,並僅使用日期部分進行連接。
由於DATE()函數,我認為它主要是慢的。 您可以向存儲整個日期的Visits添加日期列,並編寫觸發器以在插入訪問或更新其日期時自動更新它。 這將允許MySQL更好地利用連接中使用的索引。
這樣的事情:從eumiro中選擇結果的外連接?
SELECT date, v.visits as 'visits' FROM dates
LEFT OUTER JOIN (SELECT DATE(start) as dt, count(id) as 'visits'
FROM visits
WHERE account_id = 40
AND date BETWEEN '2010-12-13' AND '2011-01-13'
GROUP BY DATE(start)
ORDER BY 1)
v
ON (dates.date = v.dt )
WHERE date >= '2010-12-13' AND date <= '2011-1-13'
編輯:編輯的SQL編輯:另一個選項 - 內聯選擇,類似的東西:
SELECT date, (select count(*) as 'visits'
FROM from visits
where date = DATE(visits.start) and account_id = 40 )
) from dates
WHERE date >= '2010-12-13' AND date <= '2011-1-13'
ORDER BY date ASC
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.