DELETE查询非常慢

Question

我有SQL性能问题。 出于突发原因，以下查询非常缓慢：

我有两个列表，其中包含某个表的Id。 如果Id已存在于第二个列表中，我需要删除第一个列表中的所有记录：

DECLARE @IdList1 TABLE(Id INT)
DECLARE @IdList2 TABLE(Id INT)

-- Approach 1
DELETE list1
FROM @IdList1 list1
INNER JOIN @IdList2 list2 ON list1.Id = list2.Id

-- Approach 2
DELETE FROM @IdList1
WHERE Id IN (SELECT Id FROM @IdList2)

这两个列表可能包含超过10,000条记录。 在这种情况下，两个查询都需要超过20秒才能执行。

执行计划也显示了一些我不理解的东西。 也许这就解释了为什么它如此缓慢： 查询两个查询

我用10,000个连续的整数填充了两个列表，因此两个列表都包含值1-10.000作为起始点。

正如您所看到的，两个查询显示@ IdList2 实际行数为50.005.000 !!。 @ IdList1是正确的（ 实际行数是10.000）

我知道还有其他解决方案如何解决这个问题。 就像填写从第一个列表中删除的第三个列表一样。 但我的问题是：

为什么这些删除查询这么慢，为什么我会看到这些奇怪的查询计划？

Answer 1

向表变量添加主键并观察它们的尖叫声

DECLARE @IdList1 TABLE(Id INT primary Key not null)
DECLARE @IdList2 TABLE(Id INT primary Key not null)

因为这些表变量没有索引，所以任何连接或子查询必须检查10,000次10,000 = 100,000,000对值的顺序。

Answer 2

SQL Server在表变量为空时编译计划，并且在添加行时不重新编译它。 尝试

DELETE FROM @IdList1
WHERE Id IN (SELECT Id FROM @IdList2)
OPTION (RECOMPILE)

这将考虑表变量中包含的实际行数并删除嵌套循环计划

当然，通过约束在Id上创建索引也可能对使用表变量的其他查询有益。

Answer 3

表变量中的表可以有主键，因此如果您的数据支持这些Id的唯一性，您可以通过

DECLARE @IdList1 TABLE(Id INT PRIMARY KEY)
DECLARE @IdList2 TABLE(Id INT PRIMARY KEY)

Answer 4

可能的解决方案：

1）尝试创建索引

1.1）如果List {1 | 2} .Id列具有唯一值，那么您可以使用PK约束定义唯一的聚簇索引，如下所示：

DECLARE @IdList1 TABLE(Id INT PRIMARY KEY);
DECLARE @IdList2 TABLE(Id INT PRIMARY KEY);

1.2）如果List {1 | 2} .Id列可能具有重复值，那么您可以使用伪IDENTITY列使用PK约束定义唯一的聚簇索引，如下所示：

DECLARE @IdList1 TABLE(Id INT, DummyID INT IDENTITY, PRIMARY KEY (ID, DummyID) );
DECLARE @IdList2 TABLE(Id INT, DummyID INT IDENTITY, PRIMARY KEY (ID, DummyID) );

2）尝试添加HASH JOIN查询提示，如下所示：

DELETE list1
FROM @IdList1 list1
INNER JOIN @IdList2 list2 ON list1.Id = list2.Id
OPTION (HASH JOIN);

Answer 5

您正在使用Table Variables ，要么将主键添加到Table Variables ，要么将它们更改为Temporary Tables并添加INDEX 。 这将带来更多的性能。 根据经验，如果表只是小的，请使用TABLE Variables ，但是如果表正在扩展并包含大量数据，则使用临时表。

Answer 6

我很想尝试

DECLARE @IdList3 TABLE(Id INT);

INSERT @IdList3
SELECT Id FROM @IDList1 ORDER BY Id
EXCEPT
SELECT Id FROM @IDList2 ORDER BY Id

不需要删除。

Answer 7

尝试这种替代语法：

DELETE deleteAlias
FROM @IdList1 deleteAlias
WHERE EXISTS (
        SELECT NULL
        FROM @IdList2 innerList2Alias
        WHERE innerList2Alias.id=deleteAlias.id
    )

编辑.....................

尝试使用带有索引的#temp表。

这是一个通用示例，其中“DepartmentKey”是PK和FK。

IF OBJECT_ID('tempdb..#Department') IS NOT NULL
begin
        drop table #Department
end


CREATE TABLE #Department 
( 
    DepartmentKey int , 
    DepartmentName  varchar(12)
)



CREATE INDEX IX_TEMPTABLE_Department_DepartmentKey ON #Department (DepartmentKey)




IF OBJECT_ID('tempdb..#Employee') IS NOT NULL
begin
        drop table #Employee
end


CREATE TABLE #Employee 
( 
    EmployeeKey int , 
    DepartmentKey int ,
    SSN  varchar(11)
)



CREATE INDEX IX_TEMPTABLE_Employee_DepartmentKey ON #Employee (DepartmentKey)


Delete deleteAlias 
from #Department deleteAlias
where exists ( select null from #Employee innerE where innerE.DepartmentKey = deleteAlias.DepartmentKey )





IF OBJECT_ID('tempdb..#Employee') IS NOT NULL
begin
        drop table #Employee
end

IF OBJECT_ID('tempdb..#Department') IS NOT NULL
begin
        drop table #Department
end

DELETE查询非常慢

问题描述

7 个解决方案

解决方案1
15 已采纳 2013-05-23 13:02:46

解决方案2
12 2013-05-23 13:02:54

解决方案3
2 2013-05-23 13:03:23

解决方案4
2 2013-05-23 13:10:11

解决方案5
1 2013-05-23 13:03:57

解决方案6
0 2013-05-23 13:11:53

解决方案7
-1 2013-05-23 13:07:17

DELETE查询非常慢

问题描述

7 个解决方案

解决方案1 15 已采纳 2013-05-23 13:02:46

解决方案2 12 2013-05-23 13:02:54

解决方案3 2 2013-05-23 13:03:23

解决方案4 2 2013-05-23 13:10:11

解决方案5 1 2013-05-23 13:03:57

解决方案6 0 2013-05-23 13:11:53

解决方案7 -1 2013-05-23 13:07:17

解决方案1
15 已采纳 2013-05-23 13:02:46

解决方案2
12 2013-05-23 13:02:54

解决方案3
2 2013-05-23 13:03:23

解决方案4
2 2013-05-23 13:10:11

解决方案5
1 2013-05-23 13:03:57

解决方案6
0 2013-05-23 13:11:53

解决方案7
-1 2013-05-23 13:07:17