如何优化搜索SQL查询？

Question

我写了一个搜索查询来搜索相似的名字。 它与标签的Power Set配合使用 ，并按相似性排序。 例如，如果搜索文字是： shakespeare tragedy hamlet

生成的SQL是：

SELECT DISTINCT id FROM (
    (SELECT * FROM books 
      WHERE name LIKE '%shakespeare%' 
      AND name LIKE '%tragedy%' 
      AND name LIKE '%hamlet%' limit 10)
    UNION
    (SELECT * FROM books 
      WHERE name LIKE '%shakespeare%' 
      AND name LIKE '%tragedy%' limit 10)
    UNION
    (SELECT * FROM books 
      WHERE name LIKE '%shakespeare%'  
      AND name LIKE '%hamlet%' limit 10)
    UNION
    (SELECT * FROM books 
      WHERE name LIKE '%tragedy%' 
      AND name LIKE '%hamlet%' limit 10)
    UNION
    (SELECT * FROM books WHERE name LIKE '%shakespeare%' limit 10)
    UNION
    (SELECT * FROM books WHERE name LIKE '%tragedy%' limit 10)
    UNION
    (SELECT * FROM books WHERE name LIKE '%hamlet%' limit 10)
) limit 10

有两个问题：

Power Set在我的查询中创建2^tags - 1联合，这意味着如果有人想要精确并使用6个标签，它将是63个联合，这会使我的查询慢得多。
如果第一个联合返回10行，则其他无用。

有没有一种方法可以优化此查询？

Answer 1

我们可以获取名称与过去标记相似的所有boosk，并基于相似性添加自定义ORDER BY。 如果名称包含标签+1（如果不为0），则为0。如果名称包含所有3个标签，则SO为3（如果只有一个和为1）。

SELECT DISTINCT id 
FROM books 
where name LIKE '%shakespeare%'
   OR name LIKE '%tragedy%'
   OR name LIKE '%hamlet%'
ORDER BY IF(INSTR(name, 'shakespeare')>0,1,0)+
         IF(INSTR(name, 'tragedy')>0,1,0)+
         IF(INSTR(name, 'hamlet')>0,1,0) DESC
LIMIT 10

更新：ORDER BY可以基于总和或只是逗号

Answer 2

如果切换到FULLTEXT索引并使用

MATCH(name) AGAINST('shakespeare tragedy hamlet')

你可以得到一个有点道理排序，并且运行速度快了很多。

如果要坚持将shakespeare放在字符串中，但其他字符串是可选的，则效果更好： '+shakespeare tragedy hamlet' 。

注意： FULLTEXT有好处也有局限性。

如何优化搜索SQL查询？

问题描述

2 个解决方案

解决方案1
0 已采纳 2016-01-13 08:02:15

解决方案2
0 2016-01-13 21:10:48

如何优化搜索SQL查询？

问题描述

2 个解决方案

解决方案1 0 已采纳 2016-01-13 08:02:15

解决方案2 0 2016-01-13 21:10:48

解决方案1
0 已采纳 2016-01-13 08:02:15

解决方案2
0 2016-01-13 21:10:48