MySQL：WHERE 子句中帶有 NOT IN 的從屬子查詢非常慢

Question

我正在使用 open Id login 審核我的應用程序中的用戶詳細信息。如果用戶第一次登錄 OPEN ID，我們將其視為注冊。 我正在使用此詳細信息生成審核登錄報告。 示例表數據。

+---------+----------+-----------+---------------+
| USER_ID | PROVIDER | OPERATION | TIMESTAMP     |
+---------+----------+-----------+---------------+
|     120 | Google   | SIGN_UP   | 1347296347000 |
|     120 | Google   | SIGN_IN   | 1347296347000 |
|     121 | Yahoo    | SIGN_IN   | 1347296347000 |
|     122 | Yahoo    | SIGN_IN   | 1347296347000 |
|     120 | Google   | SIGN_UP   | 1347296347000 |
|     120 | FaceBook | SIGN_IN   | 1347296347000 |
+---------+----------+-----------+---------------+

在這個表中，我想根據提供者排除已經SIGN_UP ed " SIGN_IN " ed 的用戶數。

顯示創建表

CREATE TABLE `signin_details` (
  `USER_ID` int(11) DEFAULT NULL,
  `PROVIDER` char(40) DEFAULT NULL,
  `OPERATION` char(40) DEFAULT NULL,
  `TIMESTAMP` bigint(20) DEFAULT NULL
) ENGINE=InnoDB

我正在使用這個查詢。

select 
  count(distinct(USER_ID)) as signin_count, 
  PROVIDER from signin_details s1 
where 
  s1.USER_ID NOT IN 
  (
    select 
      USER_ID 
    from signin_details 
    where 
      signin_details.PROVIDER=s1.PROVIDER 
      and signin_details.OPERATION='SIGN_UP' 
      and signin_details.TIMESTAMP/1000 BETWEEN UNIX_TIMESTAMP(CURRENT_DATE()-INTERVAL 1 DAY) * 1000 AND UNIX_TIMESTAMP(CURRENT_DATE()) * 1000
  )  
  AND OPERATION='SIGN_IN' group by PROVIDER;

解釋輸出：

+----+--------------------+----------------+------+---------------+------+---------+------+------+-----------------------------+
| id | select_type        | table          | type | possible_keys | key  | key_len | ref  | rows | Extra                       |
+----+--------------------+----------------+------+---------------+------+---------+------+------+-----------------------------+
|  1 | PRIMARY            | s1             | ALL  | NULL          | NULL | NULL    | NULL |    6 | Using where; Using filesort |
|  2 | DEPENDENT SUBQUERY | signin_details | ALL  | NULL          | NULL | NULL    | NULL |    6 | Using where                 |
+----+--------------------+----------------+------+---------------+------+---------+------+------+-----------------------------+

查詢輸出：

+--------------+----------+
| signin_count | PROVIDER |
+--------------+----------+
|            1 | FaceBook |
|            2 | Yahoo    |
+--------------+----------+

執行 20 萬行需要 40 多分鍾。

我的假設是它將檢查每一行與依賴子查詢輸出的總數。

我對這個查詢的假設。

 A -> Dependant Outputs (B,C,D) .
 A check with B
 A check with C
 A check with D

如果相關查詢輸出較大，則執行時間會很長。 如何改進這個查詢？

Answer 1

如果您使用MySQL，您必須知道子查詢的執行速度非常慢。

IN很慢...

EXISTS通常比IN更快

JOIN主要是做這樣的事情的最快方式。

SELECT DISTINCT
  s1.PROVIDER,
  COUNT(DISTINCT s1.USER_ID)

FROM 
  signin_details s1
  LEFT JOIN 
  (
    SELECT DISTINCT
      USER_ID, PROVIDER
    FROM 
      signin_details 
    WHERE
      signin_details.OPERATION='SIGN_UP' 
      AND 
        signin_details.TIMESTAMP 
          BETWEEN 
            UNIX_TIMESTAMP(CURRENT_DATE()-INTERVAL 1 DAY) * 1000 
            AND UNIX_TIMESTAMP(CURRENT_DATE()) * 1000
  ) AS t USING  (USER_ID, PROVIDER)

WHERE
  t.USER_ID IS NULL
  AND OPERATION='SIGN_IN'
GROUP BY s1.PROVIDER

http://sqlfiddle.com/#!2/122ac/12

注意：如果您想知道 sqlfiddle 結果，請考慮這里是查詢中的UNIX_TIMESTAMP 。

結果：

| PROVIDER | COUNT(DISTINCT S1.USER_ID) |
-----------------------------------------
| FaceBook |                          1 |
|    Yahoo |                          2 |

MySQL 和INTERSECT故事。 您將獲得不想計算的USER_ID和PROVIDER所有組合。 然后LEFT JOIN它們到您的數據。 現在，您要計算的所有行都沒有來自LEFT JOIN值。 您可以通過t.USER_ID IS NULL獲取它們。

輸入：

| rn° | USER_ID | PROVIDER | OPERATION |     TIMESTAMP |
-------------------------------------------------------
| 1   |     120 |   Google |   SIGN_UP | 1347296347000 | -
| 2   |     120 |   Google |   SIGN_IN | 1347296347000 | - (see rn° 1)
| 3   |     121 |    Yahoo |   SIGN_IN | 1347296347000 | Y
| 4   |     122 |    Yahoo |   SIGN_IN | 1347296347000 | Y
| 5   |     120 |   Google |   SIGN_UP | 1347296347000 | -
| 6   |     120 | FaceBook |   SIGN_IN | 1347296347000 | F
| 7   |     119 | FaceBook |   SIGN_IN | 1347296347000 | - (see rn° 8)
| 8   |     119 | FaceBook |   SIGN_UP | 1347296347000 | -

Answer 2

在 HAVING 子句中使用“NOT IN”。 它會比“不在的地方”更快

MySQL：WHERE 子句中帶有 NOT IN 的從屬子查詢非常慢

問題描述

2 個解決方案

解決方案1
4 已采納 2012-09-10 18:31:42

解決方案2
0 2019-11-03 06:32:58

MySQL：WHERE 子句中帶有 NOT IN 的從屬子查詢非常慢

問題描述

2 個解決方案

解決方案1 4 已采納 2012-09-10 18:31:42

解決方案2 0 2019-11-03 06:32:58

解決方案1
4 已采納 2012-09-10 18:31:42

解決方案2
0 2019-11-03 06:32:58