![](/img/trans.png)
[英]SQL - matching similar records with same set of values in jumbled order
[英]Matching a set of child records between two similar table hierarchies
我有两个类似的表层次结构:
Owner -> OwnerGroup -> Parent
和
Owner2 -> OwnerGroup2
我想根据一组值确定Owner2中是否存在完全匹配的Owners。 每个所有者表中大约有一百万行。 某些OwnerGroup最多包含100个所有者。
因此,基本上,如果有一个OwnerGroup而不包含所有者“ Smith”,“ John”和“ Smith,” Jane”,我想知道完全匹配的OwnerGroup2s的ID。
首次尝试是为每个所有者生成一个联接(这需要在应用程序中生成动态sql:
select og.id
from owner_group2 og
-- dynamic bit starts here
join owner2 o1 on
(og.id = o1.og_id) AND
(o1.given_names = 'JOHN' and o1.surname='SMITH')
-- dynamic bit ends here
join owner2 o2 on
(og.id = o2.og_id) AND
(o2.given_names = 'JANE' and o2.surname='SMITH');
直到少数所有者,此方法都可以正常工作,但是当我们必须在组方案中处理100个所有者时,因为此查询计划意味着存在100个嵌套循环,因此运行将近一分钟。
我的另一个选择是在intersect
运算符周围使用某些东西。 例如
select * from (
select o.surname, o.given_names
from owner1 o1
join owner_group1 og1 on o1.og_id = og1.id
where
og1.parent_id = 1936233
)
intersect
select o.surname, o.given_names
from owner2 o2
join owner_group2 og2 on og2.id = o2.og_id;
在这种情况下,我也不确定如何吸收owner2.id-并且它仍在4-5秒范围内运行。
我觉得自己缺少明显的东西-请随时提供一些更好的解决方案!
与intersect
正确的轨道上,您只需要走得更远。 您需要将其结果重新添加到owner_groups2
表中以找到ID。
您可以使用listagg
函数将各组转换为以逗号分隔的名称列表(注意-需要11g)。 然后,您可以使用这些名称列表的交集来查找匹配项,并将其加入owner_groups2
的列表中。
我在下面创建了一个简化的示例,其中“ Dave,Jill”是两个表中都存在的组。
create table grps (id integer, name varchar2(100));
create table grps2 (id integer, name varchar2(100));
insert into grps values (1, 'Dave');
insert into grps values(1, 'Jill');
insert into grps values (2, 'Barry');
insert into grps values(2, 'Jane');
insert into grps2 values(3, 'Dave');
insert into grps2 values(3, 'Jill');
insert into grps2 values(4, 'Barry');
with grp1 as (
SELECT id, listagg(name, ',') within group (order by name) n
FROM grps
group by id
), grp2 as (
SELECT id, listagg(name, ',') within group (order by name) n
FROM grps2
group by id
)
SELECT * FROM grp2
where n in (
-- find the duplicates
select n from grp1
intersect
select n from grp2
);
注意,这仍然需要对owner_groups2
进行完整扫描; 我想不出一种可以避免这种情况的方法。 因此,您的查询可能会保持缓慢。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.