使用从属子查询优化MySQL查询

Question

我需要找到一种消除依赖子查询的方法。

我有一个可以有多种语言的文章表。 简化的表结构如下：

id，title，language，translation_set_id

1 A    en 0
2 B    en 2
3 B_ru ru 2
4 C    en 4
5 C_ru ru 4
6 D    en 6
7 D_fr fr 6

当文章没有翻译时，translation_set_id为0，或者设置为基本翻译的id。 因此B是原始的英文文章，而B_ru是该文章的俄文翻译。

我需要一个允许我返回所有俄语文章的查询，或者如果它们不存在原始语言文章。 所以它会回来。

1 A    en 0
3 B_ru ru 2
5 C_ru ru 4
6 D    en 6

到目前为止我有这个：

SELECT id, title, language, translation_set_id
FROM articles a
WHERE 
  a.translation_set_id = 0
  OR (a.language = 'ru')
  OR (a.id = a.translation_set_id AND
       0 = (SELECT COUNT(ac.id)
            FROM articles ac
            WHERE ac.translation_set_id = a.translation_set_id 
            AND ac.language = 'ru')
     )

但是这会为每一行执行子查询，从而创建一个从属查询。 有没有办法消除依赖查询？

更新： Neels的解决方案似乎有效，谢谢！

但我想知道是否有办法将解决方案推广到多语言回退？ 首先尝试获取法语，如果不存在，请尝试使用俄语，如果不存在，请显示基本翻译（英语或其他任何内容，具体取决于原始创建语言）？

UPDATE2：我使用Neel的解决方案和DRapp的解决方案构建了我所需的查询。 它可以在http://www.sqlfiddle.com/#!2/28ca8/18找到，但为了完整起见，我也会在这里通过查询。

修订数据：

CREATE TABLE articles (
  id INT,
  title VARCHAR(20),
  language VARCHAR(20),
  translation_set_id INT);

INSERT INTO articles values
  (1,'A','en',0),
  (2,'B','en',2),
  (3,'B_ru','ru',2),
  (4,'C','en',4),
  (5,'C_ru','ru',4),
  (6,'D','en',6),
  (7,'D_fr','fr',6),
  (8,'E_ru','ru', 0),
  (9,'F_fr','fr', 0),
  (10,'G_ru','ru', 10),
  (11,'G_fr','fr', 10),
  (12,'G_en','en', 10);

具有2个相关子查询的原始查询：

SELECT id, title, language, translation_set_id
FROM articles a
WHERE
  a.translation_set_id = 0
  OR (a.language = 'fr')
  OR (a.language = 'ru' AND
       0 = (SELECT COUNT(ac.id)
            FROM articles ac
            WHERE ac.translation_set_id = a.translation_set_id
            AND ac.language = 'fr'))
  OR (a.id = a.translation_set_id AND
       0 = (SELECT COUNT(ac.id)
            FROM articles ac
            WHERE ac.translation_set_id = a.translation_set_id
            AND (ac.language = 'fr' OR ac.language = 'ru'))
     );

修改后的查询：

SELECT  a.*
FROM articles a
LEFT JOIN articles ac ON ac.translation_set_id = a.id
  AND ac.language = 'fr'
LEFT JOIN articles ac2 ON ac2.translation_set_id = a.id
  AND ac2.language = 'ru'
WHERE a.translation_set_id = 0
  OR a.language = 'fr'
  OR (a.language = 'ru' AND ac.id IS NULL)
  OR (a.id = a.translation_set_id AND ac2.id IS NULL AND ac.id IS NULL);

Answer 1

根据更简化的where子句从Ypercube稍作修改调整，并且你不能使用coalesce（），我已修改为以下内容。

获取Translated = 0的所有文章，或者ID与翻译相同，表明在将其翻译成其他内容之前，它必须是原始文档。 也就是说，保证所有原始文件。

现在，左连接。 如果有相应的“俄语”文章（或其他感兴趣的语言翻译），请抓住该ID及其翻译的标题。 因此返回的记录包含原始和已翻译的引用。

SELECT
      a1.id as OriginalAricleID,
      a1.title as OriginalTitle,
      a1.language as OriginalLanguage,
      a2.id as TranslatedAricleID,
      a2.title as TranslatedTitle
   from
      Articles a1
         LEFT JOIN Articles a2
            ON a1.id = a2.translation_set_id
            AND a2.language = 'ru'
   where
         a1.translation_set_id = 0
      OR a1.id = a1.translation_set_id

它经过一次表，没有重复。 左连接指向相同的文章表，但仅适用于基于原始文章的俄语语言集。

Answer 2

你可以使用LEFT JOIN ：

SELECT a.id, a.title, a.language, a.translation_set_id
  FROM articles a
 LEFT JOIN articles ac ON ac.translation_set_id = a.translation_set_id 
                      AND ac.language = 'ru'
 WHERE a.translation_set_id = 0
    OR (a.language = 'ru')
    OR (    a.id = a.translation_set_id 
        AND ac.id IS NULL
       )
 GROUP BY a.id, a.title, a.language, a.translation_set_id

Answer 3

看看这个SQL小提琴：

http://www.sqlfiddle.com/#!2/c05d0/15

您可以使用此简单查询来实现结果。

SELECT  a.*
FROM articles a
LEFT OUTER JOIN articles ac ON ac.translation_set_id = a.translation_set_id 
AND ac.language = 'ru'
WHERE a.translation_set_id = 0
OR a.language = 'ru'
OR (a.id = a.translation_set_id AND ac.id IS NULL);

Answer 4

重写这部分：

AND
       0 = (SELECT COUNT(ac.id)
            FROM articles ac
            WHERE ac.translation_set_id = a.translation_set_id 
            AND ac.language = 'ru')

进入反连接条件：

AND NOT EXISTS (
                SELECT 1
                FROM articles ac
                WHERE ac.translation_set_id = a.translation_set_id 
                AND ac.language = 'ru'
)

这可能会加快查询速度，因为MySql必须始终读取所有行以获取count（），
但是当使用NOT EXISTS （或EXISTS ）时，它会在找到符合条件的第一行时停止读取表格。

使用从属子查询优化MySQL查询

问题描述

4 个解决方案

解决方案1
2 2014-02-24 12:49:50

解决方案2
1 2014-02-24 11:17:17

解决方案3
1 已采纳 2014-02-24 11:27:34

解决方案4
1 2014-02-24 12:17:07

使用从属子查询优化MySQL查询

问题描述

4 个解决方案

解决方案1 2 2014-02-24 12:49:50

解决方案2 1 2014-02-24 11:17:17

解决方案3 1 已采纳 2014-02-24 11:27:34

解决方案4 1 2014-02-24 12:17:07

解决方案1
2 2014-02-24 12:49:50

解决方案2
1 2014-02-24 11:17:17

解决方案3
1 已采纳 2014-02-24 11:27:34

解决方案4
1 2014-02-24 12:17:07