为什么从table_name中选择count（*）是如此之慢？

Question

mysql> select count(*)
    -> from ip_address_varchar20;
+----------+
| count(*) |
+----------+
|  2764687 |
+----------+
1 row in set (1 min 28.80 sec)

我认为应该有一个字段来存储任何表的大小，但我发现count（*）是如此之慢。

为什么DBMS不优化这个？ 或者我对此做了一些不好的练习？

Answer 1

来自： https ： //wiki.postgresql.org/wiki/Why_PostgreSQL_Instead_of_MySQL : _Comparing_Reliability_and_Speed_in_2007

已知PostgreSQL执行速度慢的一个操作是在表中执行完整的行计数，通常使用此SQL：

SELECT COUNT（*）FROM table

这很慢的原因与PostgreSQL中的MVCC实现有关。 多个事务可以看到数据的不同状态的事实意味着“COUNT（*）”在整个表中汇总数据没有直接的方法; 在某种意义上，PostgreSQL必须遍历所有行。 这通常会导致顺序扫描读取有关表中每一行的信息。

Postgres的上述解释也适用于MySQL的InnoDB。 由于InnoDB使用MVCC。

有一些方法可以使用InnoDB进行快速计数。 例如，您可以使用估计，或者您可以使用触发器来维护表的行数。

Answer 2

有些数据库会在外部存储表的大小。 但是，大多数数据库直接或通过索引读取所有数据，以满足COUNT()查询。

这可确保准确计算行数。 它还考虑了事务语义。

为什么从table_name中选择count（*）是如此之慢？

问题描述

2 个解决方案

解决方案1
1 已采纳 2019-04-04 04:02:14

解决方案2
-1 2019-04-04 02:56:08

为什么从table_name中选择count（*）是如此之慢？

问题描述

2 个解决方案

解决方案1 1 已采纳 2019-04-04 04:02:14

解决方案2 -1 2019-04-04 02:56:08

解决方案1
1 已采纳 2019-04-04 04:02:14

解决方案2
-1 2019-04-04 02:56:08