MYSQL在大型数据集中优化带有子查询的左联接（查询花费的时间太长）

Question

我有一个很大的数据集，我必须做3个联接，其中之一是子查询。 我选择使用子查询而不是WHERE（IN或FIND_IN_SET），以便不会丢失左侧表或基表中的值。 我需要左栏中的所有数据。 总体而言，我将1100万个值与900,000个值进行匹配，因此我希望这会花费很长时间，但是在200个值上花了大约20秒。

引擎是innoDB，每个表都有一个主键（IDvar）。

我使用子查询是因为我有很多需要从中选择的值（ val1, val2,..., val100 ），而且我想避免对每个“ val”使用带有子句的“ AND”命令。

我正在使用的查询是：

    SELECT *
    FROM table1
    LEFT JOIN (SELECT * FROM table2 WHERE table2.var IN(val1, val2,..., val100)) AS t
        USING (IDvar)
    LEFT JOIN table3 
        USING (IDvar);

Answer 1

该查询对我来说很好。 您需要以下索引：

create index idx_t1 on table1(idvar);
create index idx_t2 on table2(var, idvar);
create index idx_t3 on table3(idvar);

（也许只是缺少的第二个。）

Answer 2

我可以澄清一下为什么不使用ON语句吗？

通常，当我加入时，我将执行以下操作

SELECT * 
    FROM table1 JOIN table2 ON table1.common_var = table2.common_var
                JOIN table3 ON table1.common_var2 = table3.common_var2
    WHERE ...;

这样就无需加载整个巨大的表。

如果需要获取两个表的所有可能组合，我们可以分别获取两个表并以编程方式获取组合。

SELECT * FROM table1;
SELECT * FROM table2;
... the rest in another program ...

Answer 3

这不会执行相同的任务吗？ 可能更有效？

SELECT t1.*, t2.*, t3.*
FROM      table1 AS t1
LEFT JOIN table2 AS t2  USING (IDvar)
LEFT JOIN table3 AS t3  USING (IDvar)
WHERE t2.var IN(val1, val2,..., val100);

所需索引：

t2:  (IDvar, var)  -- in this order
t3:  (IDvar)

t1不会使用任何索引。

是否拥有LEFT此查询有很大的不同。

MYSQL在大型数据集中优化带有子查询的左联接（查询花费的时间太长）

问题描述

3 个解决方案

解决方案1
2 2018-03-28 12:49:32

解决方案2
0 2018-03-28 08:32:13

解决方案3
0 2018-03-30 23:19:34

MYSQL在大型数据集中优化带有子查询的左联接（查询花费的时间太长）

问题描述

3 个解决方案

解决方案1 2 2018-03-28 12:49:32

解决方案2 0 2018-03-28 08:32:13

解决方案3 0 2018-03-30 23:19:34

解决方案1
2 2018-03-28 12:49:32

解决方案2
0 2018-03-28 08:32:13

解决方案3
0 2018-03-30 23:19:34