繁体   English   中英

SQL 保证邻接表中节点名唯一

[英]SQL to ensure unique node names in adjacency list

所以我有一个邻接列表,其中 forms 是一个模拟版本化文件结构的层次结构。 问题是传入的文件名当前不是唯一的,它们必须是唯一的。 为了让事情变得更有趣,这些文件可能有不同的版本,应该保留第一个版本的名称(注意所有版本都具有相同的 NodeID)。

邻接表

父母ID 节点ID 版本号 文件名
-1 1 1 第一文件夹
1 2 1 第二文件夹
1 3 1 第三文件夹
1 4 1 第一文件
1 4 2 第一文件
1 5 1 第一文件
1 5 2 第一文件
2 6 1 第一文件
2 6 2 第一文件
2 7 1 第二文件
3 8 1 第二文件
3 9 1 第三文件
3 9 2 第三文件
3 10 1 第三文件
3 11 1 第三文件

目标结果

父母ID 节点ID 版本号 文件名
-1 1 1 第一文件夹
1 2 1 第二文件夹
1 3 1 第三文件夹
1 4 1 第一文件
1 4 2 第一文件
1 5 1 第一个文档_1
1 5 2 第一个文档_1
2 6 1 第一文件
2 6 2 第一文件
2 7 1 第二文件
3 8 1 第二文件
3 9 1 第三文件
3 9 2 第三文件
3 10 1 第三文档_1
3 11 1 第三文档_2

*我还应该注意,文件夹名称已经保证是唯一的(它们已经存在,它是传入的文档)并且它们只有 1 个版本。


CREATE TABLE #tmp_tree
(
    ParentID INT,
    NodeID INT,
    VersionNum INT,
    FileName VARCHAR(50),
);

INSERT INTO  #tmp_tree (ParentID, NodeID, VersionNum, FileName)
VALUES (-1, 1, 1, 'FirstFolder' ),
 (1, 2, 1, 'SecondFolder' ),
 (1, 3, 1, 'ThirdFolder' ),
 (1, 4, 1, 'FirstDocument' ),
 (1, 4, 2, 'FirstDocument' ),
 (1, 5, 1, 'FirstDocument' ),
 (1, 5, 2, 'FirstDocument' ),
 (2, 6, 1, 'FirstDocument' ),
 (2, 6, 2, 'FirstDocument' ),
 (2, 7, 1, 'SecondDocument' ),
 (3, 8, 1, 'SecondDocument' ),
 (3, 9, 1, 'ThirdDocument' ),
 (3, 9, 2, 'ThirdDocument' ),
 (3, 10, 1, 'ThirdDocument' )
 (3, 11, 1, 'ThirdDocument' )

我真的不知道如何通过存储过程来解决这个问题。 邻接列表向我尖叫 CTE,但这让我没有真正的快。 Group By 丢失了 NodeID,因此虽然我可以找到需要重命名的文档的名称 - 我不知道如何将其用于 select 第二次出现的名称(按 NodeID 排序)。

-- I don't see how this helps... but this finds the names that need to change.
select ParentID, FileName,VersionNum, count(*) from #tmp_tree 
 GROUP BY ParentID, FileName, VersionNum
 HAVING VersionNum = 1 and count(*) > 1
 order by FileName

我知道如何解决这个程序,但不是声明式的。

我不知道这是离解决方案更近还是更远:

 select f2.*, Row_Number() over (order by f2.FileName) from 
 (select top 10 f.*, count(FileName) over (PARTITION by ParentID, FileName) as n from (select * from #tmp_tree where versionNum = 1) as f
 order by f.ParentID, f.FileName) as f2
 Where n > 1

我会假设目标结果中的最后一行 (3, 11) 是一个错误。

您可以在子查询中找到带有 window function 的重复名称,然后在更新期间加入它。 简而言之,您可以这样做:

update #tmp_tree
set #tmp_tree.filename = concat(#tmp_tree.filename, '_', x.rn)
from #tmp_tree
join (
  select *,
    row_number() over(partition by parentid, filename order by nodeid) as rn
  from #tmp_tree
  where versionnum = 1
) x on x.rn > 1 and x.nodeid = #tmp_tree.nodeid;

结果:

 ParentID  NodeID  VersionNum  FileName        
 --------- ------- ----------- --------------- 
 -1        1       1           FirstFolder     
 1         2       1           SecondFolder    
 1         3       1           ThirdFolder     
 1         4       1           FirstDocument   
 1         4       2           FirstDocument   
 1         5       1           FirstDocument_2 
 1         5       2           FirstDocument_2 
 2         6       1           FirstDocument   
 2         6       2           FirstDocument   
 2         7       1           SecondDocument  
 3         8       1           SecondDocument  
 3         9       1           ThirdDocument   
 3         9       2           ThirdDocument   
 3         10      1           ThirdDocument_2 

请参阅db<>fiddle的运行示例。

您不需要自连接表,您可以直接更新派生表,使用DENSE_RANK计算行数后

update x
set filename = concat(x.filename, '_', x.rn)
from (
  select *,
    dense_rank() over(partition by parentid, filename order by nodeid) as rn
  from #tmp_tree
) x
where x.rn > 1;

db<>小提琴

DENSE_RANK将根据 ordering 子句为并列结果返回相同的数字。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM