批量更新4000万行的最佳方法

Question

基本上我需要在一个有4000万行的表上运行它，一次更新每一行都会崩溃，所以我想批量查询，这样如果它崩溃，它可以重新运行查询，它会跳过完成的批处理继续留下剩下的。

UPDATE [table]
SET [New_ID] = [Old_ID]

最快的方法是什么？ 以下是创建表的方式：

CREATE TABLE [table](
    [INSTANCE_ID] [int] NOT NULL,
    [table_ID] [bigint] IDENTITY(1,1) NOT NULL,
    [old_ID] [bigint] NOT NULL,
    [new_ID] [bigint] NOT NULL,
    [owner_ID] [int] NOT NULL,
    [created_time] [datetime] NULL
) ON [PRIMARY]

created_time，owner_ID上还有索引。

编辑：我的更新声明完全如图所示，我只需要将old_id中的每个条目复制到new_id中以获得4000万行。

Answer 1

Declare @Rowcount INT = 1;

WHILE (@Rowcount > 0)   
BEGIN
        UPDATE TOP (100000) [table]   --<-- define Batch Size in TOP Clause
           SET [New_ID] = [Old_ID]
        WHERE [New_ID] <> [Old_ID]

        SET @Rowcount = @@ROWCOUNT;

       CHECKPOINT;   --<-- to commit the changes with each batch
END

Answer 2

M.Ali的建议会起作用，但是当您处理40M记录时，最终会降低性能。 我会建议一个更好的过滤器来查找每次传递中要更新的记录。 这将假设您的标识列上有一个主键（或其他索引）：

DECLARE @Rowcount INT = 1
    ,   @BatchSize INT = 100000
    ,   @StartingRecord BIGINT = 1;

WHILE (@Rowcount > 0)   
BEGIN
    UPDATE [table]
        SET [New_ID] = [Old_ID]
    WHERE [table_ID] BETWEEN @StartingRecord AND @StartingRecord + @BatchSize - 1;

    SET @Rowcount = @@ROWCOUNT;

    CHECKPOINT;

    SELECT @StartingRecord += @BatchSize
END

这种方法将允许每次迭代与第一次迭代一样快。 如果您没有有效的索引，则需要先修复它。

Answer 3

Select 1;  -- this will set a rowcount
WHILE (@@Rowcount > 0)   
BEGIN
  UPDATE TOP (1000000) [table]   
    SET [New_ID] =  [Old_ID]
  WHERE [New_ID] <> [Old_ID] 
    or ([New_ID] is null and [Old_ID] is not null)
END

100000可能更适合顶部。

由于NewID和OldID不为null，因此不需要进行null检查。

Answer 4

最快的方法是：

1）创建临时表，并使用create（select having condition）语句将旧表中的所有值插入到临时表中。

2）复制约束并刷新索引。

3）放下旧桌子。

4）将临时表重命名为原始名称。

此链接提供完整的讨论

批量更新4000万行的最佳方法

问题描述

4 个解决方案

解决方案1
13 已采纳 2016-09-09 21:01:49

解决方案2
3 2016-09-09 21:56:14

解决方案3
3 2016-09-11 10:59:18

解决方案4
2 2018-03-30 04:34:20

批量更新4000万行的最佳方法

问题描述

4 个解决方案

解决方案1 13 已采纳 2016-09-09 21:01:49

解决方案2 3 2016-09-09 21:56:14

解决方案3 3 2016-09-11 10:59:18

解决方案4 2 2018-03-30 04:34:20

解决方案1
13 已采纳 2016-09-09 21:01:49

解决方案2
3 2016-09-09 21:56:14

解决方案3
3 2016-09-11 10:59:18

解决方案4
2 2018-03-30 04:34:20