SQL：删除自联接中的重复项

Question

我有下表（称为 t1）：

| id | Name    |
| 1  | Charlie |
| 2  | Bob     |
| 3  | Alice   |

我想将表与自身匹配（自联接），但只选择尚未出现的组合。 到目前为止，我有以下几点：

select * from t1 a, t1 b
where a.id != b.id

这给了我这个结果：

| a.id | a.Name  | b.id | b.Name  |
| 2    | Bob     | 1    | Charlie | 
| 3    | Alice   | 1    | Charlie | 
| 1    | Charlie | 2    | Bob     | 
| 3    | Alice   | 2    | Bob     | 
| 1    | Charlie | 3    | Alice   | 
| 2    | Bob     | 3    | Alice   |

我只希望一个 id 从表 a 中出现一次，从表 b 中出现一次。 期望的结果是：

| a.id | a.Name  | b.id | b.Name  |
| 2    | Bob     | 1    | Charlie | 
| 3    | Alice   | 2    | Bob     | 
| 1    | Charlie | 3    | Alice   |

但我对如何保证这一点感到困惑。

我正在使用 SQL Server 2017。

这是我的测试的小提琴： DEMO

PS：我已经检查过这个问题，但是在我自己的例子中，使用“小于”作为比较运算符的解决方案的概念对我来说并不明确。

编辑：没有关于选择哪一对的规则； 这些对可以是 (2,3), (3,1), (1,2) 而不是我上面介绍的那些，因为我感兴趣的唯一规则是表 a 和表 b 中的每个 id 只有一次，和a.id != b.id 。

编辑2：没有匹配它们的逻辑，请把它想象成这个可能的前提：我正在为爱丽丝、鲍勃和查理做媒，就好像他们在进行秘密礼物交换一样。 他们只能给一个人送礼物，只能收一件礼物，不能给自己送礼物。 （我认为这允许可扩展性）

Answer 1

这是一种使用ROW_NUMBER技巧将每个名称与不同名称交错的选项：

WITH cte AS (
    SELECT id, Name, ROW_NUMBER() OVER (ORDER BY id) rn
    FROM t1
)

SELECT
    t1.Name,
    t2.Name
FROM cte t1
INNER JOIN cte t2
    ON (t1.rn % (SELECT COUNT(*) FROM cte)) + 1 = t2.rn;

演示

逻辑是将行号 1 与 2、2 与 3、3 与 1 匹配（我们使用模数在边缘情况下环绕）。 这确保在给定的列中不会出现任何名称多次。

Answer 2

OP 想要匹配为每个人分配一个随机伙伴，该解决方案不是完全随机的，只有在 ID 连续时才有效。 但是，它可以通过调用组合 random/order_by/row_number 来修复

我的懒惰修复是：

select * from t1 a, t1 b
where a.id = b.id % ( select count(*) from t1 c) + 1

Answer 3

使用row_number() 。 然后根据行号进行自连接。

select a.id, a.name, b.id, b.name from
    (select row_number() over (order by id desc) rn, id, name from t1) a
join 
    (select row_number() over (order by id asc) rn, id, name from t1) b on a.rn= b.rn

Answer 4

这是执行此操作的另一种方法。

这将根据两个 id 中的哪个更大来对数据进行分区，并创建一个连接字符串 (larger_id,'|',smaller_id)

之后，我通过检查 rnk=1 的位置在连接的字符串上只选择一个值。

with data
as (
select a.id a_id,a.name as a_name,b.name as b_name,b.id b_id
       ,row_number() over(partition by case when a.id>b.id then concat(a.id,'|',b.id) 
                                            else concat(b.id,'|',a.id) end
                              order by b.id desc)
        as rnk
  from t1 a
  join t1 b
    on a.id != b.id
     )
select *
  from data
 where rnk=1

https://dbfiddle.uk/?rdbms=sqlserver_2017&fiddle=c3f82c8d21dc14899a263adacf1b31e6

SQL：删除自联接中的重复项

问题描述

4 个解决方案

解决方案1
2 已采纳 2019-12-03 05:37:01

演示

解决方案2
0 2019-12-03 05:08:19

解决方案3
0 2019-12-03 05:15:02

解决方案4
0 2019-12-03 12:55:29

SQL：删除自联接中的重复项

问题描述

4 个解决方案

解决方案1 2 已采纳 2019-12-03 05:37:01

演示

解决方案2 0 2019-12-03 05:08:19

解决方案3 0 2019-12-03 05:15:02

解决方案4 0 2019-12-03 12:55:29

解决方案1
2 已采纳 2019-12-03 05:37:01

解决方案2
0 2019-12-03 05:08:19

解决方案3
0 2019-12-03 05:15:02

解决方案4
0 2019-12-03 12:55:29