大表上的MYSQL低效计数

Question

我有一个具有这种结构的表：

id(int), aff_id(int)

如果用户不是任何人的会员，并且他直接注册，则字段aff_id为0如果用户是其他玩家的会员，则字段aff_id larger than 0 ，并且在这种情况下，它将取会员的ID值。

user #47 was affiliated by user #55, therefore in the database,
we will have this entry: id=47,aff_id=55

我想看看有多少用户做得很好，并与其他用户建立了联盟/关系（基本上我想看看有多少用户是联盟成员）。 为此，我需要遍历每个用户，看看是否有人在aff_id字段内具有其用户ID。 我不想看到有多少用户的aff_id > 0 ，因为这是基本的东西，这意味着有多少名玩家附属。

根据我的要求，我运行以下查询：

SELECT 
COUNT(*),
(SELECT COUNT(*) 
FROM `users` 
WHERE `aff_id`=`u`.`id`
) AS total_pl 
FROM `users` u 
HAVING total_pl>0

问题是，在具有2000个条目的数据库上，查询大约需要30秒。

如果我尝试其他方式，则需要花费更多时间...大约40秒：

SELECT 
  COUNT(*) 
FROM `users` u 
WHERE u.id IN (
  SELECT DISTINCT (`aff_id`) 
  FROM users 
  WHERE aff_id<>0
)

您还建议我尝试其他哪些方法进行优化？

我正在考虑修改第一个查询，以停止计算每个用户有多少个附属玩家，而仅在每个用户有0个附属玩家或至少一个附属玩家的情况下才查找，但似乎没有任何区别。

Answer 1

那呢：

SQL小提琴

MySQL 5.5.32模式设置 ：

CREATE TABLE users
    (`id` int, `aff_id` int)
;

INSERT INTO users
    (`id`, `aff_id`)
VALUES
    (47, 55),
    (48, 0),
    (49, 55),
    (50, 56),
    (51, 56),
    (53, 57)
;

查询1 ：

SELECT COUNT(distinct aff_id)
FROM users
WHERE aff_id <> 0

结果：

| COUNT(DISTINCT AFF_ID) |
|------------------------|
|                      3 |

这会给你你想要的

“我想看看有多少用户做得很好，并与其他用户建立了联盟/合作关系（基本上我想看到有多少用户是联盟会员）”

Answer 2

获取每个会员的用户数

看来您真的根本不需要使用id 。 为什么不只是

SELECT aff_id, count(*) FROM users
WHERE aff_id <> 0 
GROUP BY aff_id

如果那不是您的意思，请更好地解释自己。

Answer 3

SELECT 
  u.id,
  COUNT(aff.id) as aff_num
FROM `users` u 
LEFT JOIN `users` aff 
ON u.id = aff.aff_id
GROUP BY u.id
ORDER BY aff_num DESC
HAVING aff_num>0

这是sqlfiddle，它需要2ms-5ms来对65条记录执行查询。

您可以玩更多。 我非常确定，即使表没有正确索引，使用2000条记录，您也永远不会超过3s。

因此，我认为我的查询速度非常快，并且有证明。

你有你的吗？

大表上的MYSQL低效计数

问题描述

3 个解决方案

解决方案1
2 已采纳 2015-03-03 19:44:33

解决方案2
2 2015-03-03 19:47:45

解决方案3
0 2015-03-03 19:50:32

大表上的MYSQL低效计数

问题描述

3 个解决方案

解决方案1 2 已采纳 2015-03-03 19:44:33

解决方案2 2 2015-03-03 19:47:45

解决方案3 0 2015-03-03 19:50:32

解决方案1
2 已采纳 2015-03-03 19:44:33

解决方案2
2 2015-03-03 19:47:45

解决方案3
0 2015-03-03 19:50:32