[英]Performance on an update/delete query
我想用同一张表中生成的值更新我的表。
我的目标是搜索所有带有proftxt的行,例如_NS和_WP,并使用相同的ao,将它们汇总,
将值除以该ao的_H,_G,_L-Elements的数量,然后将此值添加到该ao的_H,_G和_L对象中。
ao可能只有_NS和_WP行。 比例行程序应该跳过这一点。
例:
我的数据如下:
an, ao, proftxt, value, year
101 , 1, 'e_NSe', 5, 2006
102 , 1, 'e_Ha', 1, 2006
103 , 1, 'w_NSr', 4, 2006
104 , 2, 'w_NSr', 2, 2006
105 , 2, 'x_H05r', 4, 2006
106 , 2, 'w_Gr', 2, 2006
107 , 2, 'a_WPr', 4, 2006
108 , 3, 'a_WPr', 4, 2006
我的数据应该像:
an, ao, proftxt, value, year
102 , 1, 'e_Ha', 10 2006
103 , 2, 'x_H05r', 7, 2006
103 , 2, 'w_Gr', 5, 2006
108 , 3, 'a_WPr', 4, 2006
我的例程适用于少量的测试数据。
成功使用13个小时后,更新功能将在实际数据库上运行时结束。
但是它仅编辑了210000行中的5000行。
DECLARE @ENDYEAR INT
DECLARE @AO BIGINT
DECLARE @YEAR INT
DECLARE @ELEMENTS INT
--Parameter festlegen
SET @YEAR = 2006
SET @ENDYEAR = 2013 --Endyear+1
SET @AO = 2
WHILE(@YEAR<@ENDYEAR)
BEGIN
WHILE (@AO >1) --Do as long as Cursor is inside table
BEGIN
SET @AO = (SELECT TOP 1 ao FROM tbl_slp -- Search ao with _WP _NS
WHERE (proftxt LIKE '%[_]WP%'
OR proftxt LIKE '%[_]NS%')
AND year = @YEAR
AND ao > @AO );
SET @ELEMENTS = (SELECT COUNT(proftxt) --Count Number of _H, _G, _L elements
FROM tbl_SLP
WHERE ao = @AO AND year = @YEAR AND
(proftxt LIKE '%[_]H%' OR proftxt = NULL
OR proftxt LIKE '%[_]G%'
OR proftxt LIKE '%[_]L%'))
IF (@ELEMENTS != 0)
BEGIN
UPDATE tbl_SLP --Update _H, _G, _L rows
SET value = value + (SELECT SUM(CONVERT(float, value))
FROM tbl_SLP
WHERE (proftxt LIKE '%[_]WP%'
OR proftxt LIKE '%[_]NS%')
AND year = @YEAR
AND ao = @AO)
/@ELEMENTS
WHERE ao = @AO AND year = @YEAR
DELETE FROM tbl_SLP --delete_WP _NS rows
WHERE ao= @AO
AND year = @YEAR
AND (proftxt LIKE '%[_]WP%' OR proftxt LIKE '%[_]NS%')
END
SET @AO = @AO +1
END
SET @YEAR = @YEAR +1
END
我知道例程非常慢,但是我该怎么办?
SQL是为基于集合的操作而不是像例程一样的过程控制流样式逻辑而设计的。 这是一种基于集合的方法,我想它将比过程方法快得多:
SET XACT_ABORT ON
SET NOCOUNT ON
BEGIN TRANSACTION
-- Create a temp table with each ao-year's sums and counts (sums of _NS and _WP record values and counts of _H, _G, and _L records)
SELECT T.ao, T.year, SUM(T.value) AS SumVals, (SELECT COUNT(*) FROM tbl_slp A WHERE A.ao = T.ao AND A.year = T.year AND (A.proftxt = NULL OR A.proftxt LIKE '%[_]H%' OR A.proftxt LIKE '%[_]G%' OR A.proftxt LIKE '%[_]L%')) AS CountOther
INTO #temp1
FROM tbl_slp T
WHERE (T.proftxt LIKE '%[_]WP%' OR T.proftxt LIKE '%[_]NS%')
GROUP BY T.ao, T.year
-- Add "sum/count" for each ao-year to the _H, _G, and _L records for that year
UPDATE A
SET value = value + CONVERT(FLOAT, T.SumVals) / T.CountOther
FROM tbl_slp A
INNER JOIN #temp1 T ON A.ao = T.ao AND A.year = T.year
WHERE (A.proftxt = NULL OR A.proftxt LIKE '%[_]H%' OR A.proftxt LIKE '%[_]G%' OR A.proftxt LIKE '%[_]L%')
-- Now that we've distributed the _WP and _NS values, delete those records
DELETE A
FROM tbl_slp A
INNER JOIN #temp1 T ON A.ao = T.ao AND A.year = T.year
WHERE (A.proftxt LIKE '%[_]WP%' OR A.proftxt LIKE '%[_]NS%')
AND T.CountOther > 0
COMMIT TRANSACTION
对于您提供的样本集,这将产生完全相同的结果(除了我认为是错字的an
列)。
完全公开后,样本集所需的时间比常规时间要长(17毫秒比3毫秒),但是它可以更好地扩展到大数据。 我将它放在事务中是为了确保正确性,但是我不确定您的确切用例是什么,因此这可能会不利于我的方式,因为它会在整个时间内锁定页面(并可能升级到整个表)。 但是,您的例行程序没有任何事务,这可能会导致数据出错,因此,如果您坚持自己的方式,请确保将每个更新删除对放在自己的事务中。
另外,如果您在proftxt
上没有索引,请添加一个! 这将对两种解决方案都产生巨大的影响。
祝好运。 这是我使用的SQL Fiddle 。
首先,我看到一些与NULL相关的问题。 例如,您的内部循环显然在等待@AO变为NULL才完成:
WHILE (@AO >1)
当您将@AO设置为不存在的东西时,这将起作用,但是很难阅读,并且您可能想编写更明确的逻辑。
接下来,此条件将始终为false:
OR proftxt = NULL
NULL值不等于其自身。 要测试这种情况,您必须编写:
OR proftxt IS NULL
另外,您的COUNT(proftxt)中将忽略所有NULL值。 尝试运行以下示例查询。 它返回1,并显示消息“警告:通过聚合或其他SET操作消除了空值”。
SELECT COUNT(fieldname) FROM (SELECT 1 AS fieldname UNION SELECT NULL AS fieldname) AS tablename
最后,为proftxt列建立索引不会解决您的性能问题 ,因为带有前导通配符的LIKE条件无法使用该索引。 您可以想到索引,例如电话簿,按姓氏字母顺序排列。 如果您正在寻找LastName LIKE'%mann',那么索引将无济于事。 您仍然必须通读电话簿中的每个条目,以找到所有以“ mann”结尾的姓氏。 用数据库术语来说,这称为“表扫描”,并且很慢。
我将添加一个新列,您可以将其称为proftxttype。
UPDATE tbl_SLP
SET proftxttype = 1
WHERE proftxt LIKE '%[_]WP%'
OR proftxt LIKE '%[_]NS%'
UPDATE tbl_SLP
SET proftxttype = 2
WHERE proftxt LIKE '%[_]H%'
OR proftxt LIKE '%[_]G%'
OR proftxt LIKE '%[_]L%'
OR proftxt IS NULL
然后索引此列:
CREATE NONCLUSTERED INDEX [IX_PROFTXTTYPE] ON [dbo].[TBL_SLP] (PROFTXTTYPE ASC) ON [PRIMARY]
现在,根据proftxttype重写您的更新。 当然,每当您插入或更新proftxt时,也将必须更新proftxttype。 这是不可避免的,但是SQL Server将负责使索引保持最新状态,因此您不必担心索引。
我知道这听起来需要做很多工作,但是问题的核心在于,每当您要查找带有前导通配符的proftxt值时,便要扫描整个表。
我结合了两个(非常有帮助!)答案。 正如criticalfix告诉我的那样,我添加了一个coloum proftype来在表上设置索引:
ALTER TABLE
ADD proftype CHAR(1)
GO
UPDATE tbl_SLPverrechnetWPNSP
SET proftype = 'W'
WHERE proftxt LIKE '%[_]WP%'
UPDATE tbl_SLP
SET proftype = 'N'
WHERE proftxt LIKE '%[_]NS%'
UPDATE tbl_SLP
SET proftype = 'H'
WHERE proftxt LIKE '%[_]H%'
OR proftxt IS NULL
UPDATE tbl_SLP
SET proftype = 'G'
WHERE proftxt LIKE '%[_]G%'
UPDATE tbl_SLP
SET proftype = 'L'
WHERE proftxt LIKE '%[_]L%'
--set index on proftype
CREATE NONCLUSTERED INDEX [IX_PROFTYPE] ON [dbo].[tbl_SLP] (proftype ASC) ON [PRIMARY]
GO
接下来,我使用bob中的代码来编辑表。
SET XACT_ABORT ON
SET NOCOUNT ON
BEGIN TRANSACTION
-- Create a temp table with each ao-year's sums and counts (sums of N and W record values and counts of H, G, and L records)
SELECT T.ao, T.year, SUM(CONVERT(float, T.value)) AS SumVals, (SELECT COUNT(*)
FROM tbl_slp A
WHERE A.ao = T.ao
AND A.year = T.year
AND (A.proftype ='G' OR A.proftype = 'H' OR A.proftype = 'L' ))
AS CountOther
INTO #temp1
FROM tbl_slp T
WHERE (T.proftype = 'W' OR T.proftype = 'N')
GROUP BY T.ao, T.year
-- Add "sum/count" for each ao-year to the H, G, and L records for that year
UPDATE A
SET value = value + CONVERT(FLOAT, T.SumVals) / T.CountOther
FROM tbl_slp A
INNER JOIN #temp1 T ON A.ao = T.ao AND A.year = T.year
WHERE (A.proftype = 'H' OR A.proftype = 'G' OR A.proftype LIKE 'L')
-- Now that we've distributed the W and N values, delete those records
DELETE A
FROM tbl_slp A
INNER JOIN #temp1 T ON A.ao = T.ao AND A.year = T.year
WHERE (A.proftype = 'W' OR A.proftype = 'N')
AND T.CountOther > 0
DROP TABLE #temp1
COMMIT TRANSACTION
非常感谢你的帮助! 例行程序仅运行了3.5分钟!!!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.