MySQL分組查詢優化

Question

我有三個表：類別，文章和article_events，具有以下結構

categories: id, name                        (100,000 rows)
articles: id, category_id                   (6000 rows)
article_events: id, article_id, status_id   (20,000 rows)

每篇文章行的最高article_events.id描述了每篇文章的當前狀態。

我正在返回一個類別表，其中包含最近事件status_id為“1”的文章數量。

到目前為止我的工作，但是我的桌子大小相當慢（10秒）。 想知道是否有辦法讓這更快。 據我所知，所有表都有適當的索引。

SELECT c.id, 
       c.name, 
       SUM(CASE WHEN e.status_id = 1 THEN 1 ELSE 0 END) article_count
FROM categories c
LEFT JOIN articles a ON a.category_id = c.id
LEFT JOIN (
    SELECT article_id, MAX(id) event_id
    FROM article_events
    GROUP BY article_id
) most_recent ON most_recent.article_id = a.id
LEFT JOIN article_events e ON most_recent.event_id = e.id
GROUP BY c.id

基本上我必須兩次加入事件表，因為要求status_id和MAX（id）只返回它找到的第一個status_id，而不是與MAX（id）行相關的那個。

有什么辦法讓這更好嗎？ 或者我只需要活10秒鍾？ 謝謝！

編輯：

這是我的EXPLAIN查詢：

ID | select_type | table          | type   | possible_keys | key         | key_len | ref                  | rows   | Extra 
---------------------------------------------------------------------------------------------------------------------------
1  | PRIMARY     | c              | index  | NULL          | PRIMARY     | 4       | NULL                 | 124044 | Using index; Using temporary; Using filesort
1  | PRIMARY     | a              | ref    | category_id   | category_id | 4       | c.id                 | 3      |
1  | PRIMARY     | <derived2>     | ALL    | NULL          | NULL        | NULL    | NULL                 | 6351   |
1  | PRIMARY     | e              | eq_ref | PRIMARY       | PRIMARY     | 4       | most_recent.event_id | 1      |
2  | DERIVED     | article_events | ALL    | NULL          | NULL        | NULL    | NULL                 | 19743  | Using temporary; Using filesort

Answer 1

如果可以使用JOIN消除子查詢，則它通常表現更好，因為派生表不能使用索引。 這是沒有子查詢的查詢：

SELECT c.id, 
       c.name, 
       COUNT(a1.article_id) AS article_count
FROM categories c
LEFT JOIN articles a ON a.category_id = c.id
LEFT JOIN article_events ae1
  ON ae1.article_id = a.id
LEFT JOIN article_events ae2
  ON ae2.article_id = a.id
  AND ae2.id > a1.id
WHERE ae2.id IS NULL
GROUP BY c.id

您將要試驗索引並使用EXPLAIN進行測試，但這是我的猜測（我假設id字段是主鍵，而您正在使用InnoDB）：

categories: `name`
articles: `category_id`
article_events: (`article_id`, `id`)

Answer 2

沒試過，但我想這會為數據庫節省一些工作：

SELECT ae.article_id AS ref_article_id, 
    MAX(ae.id) event_id, 
    ae.status_id,
    (select a.category_id from articles a where a.id = ref_article_id) AS cat_id,
    (select c.name from categories c where c.id = cat_id) AS cat_name
FROM article_events
GROUP BY ae.article_id

希望有所幫助

編輯：

順便說一句......請記住，連接必須經過每一行，所以你應該從小端開始選擇並按照你的方式工作，如果你能幫助的話。 在這種情況下，查詢必須運行100,000個記錄，並加入每個記錄，然后再次加入這些100,000，並再次，再次，即使值為null，它仍然必須經歷這些。

希望這一切都有幫助......

Answer 3

我不喜歡使用categories.id上的索引，因為你選擇了整個表。

試試跑步：

ANALYZE TABLE categories;
ANALYZE TABLE article_events;

並重新運行查詢。

MySQL分組查詢優化

問題描述

3 個解決方案

解決方案1
1 已采納 2012-05-10 19:11:14

解決方案2
0 2012-05-10 18:11:06

解決方案3
0 2012-05-10 18:20:09

MySQL分組查詢優化

問題描述

3 個解決方案

解決方案1 1 已采納 2012-05-10 19:11:14

解決方案2 0 2012-05-10 18:11:06

解決方案3 0 2012-05-10 18:20:09

解決方案1
1 已采納 2012-05-10 19:11:14

解決方案2
0 2012-05-10 18:11:06

解決方案3
0 2012-05-10 18:20:09