[英]Overlap / intersection between subsets of rows in two tables
我在Sql Server中有两个表,一个表包含文件的ID和这些原始文件中包含的幻灯片,另一个表包含“节”,其中“节”可以包含一个或多个文件中的幻灯片,可能以任意顺序,重复和/或删除了一些幻灯片。
示例数据如下所示:
FileSlide
FileID SlideID
214 716
214 717
214 718
223 770
223 771
223 772
223 773
223 774
223 775
SectionSlide
SectionID SlideID
527 716
527 718
527 717
527 770
527 773
527 774
527 775
527 774
我最初不需要“ SectionFile”关系,但是现在我需要该信息来查看为特定部分选择了哪些文件,而与幻灯片的详细信息无关。 我的问题是检查的幻灯片编号SectionSlide
和FileSlide
表,以查看是否有任何给定文件的区间对幻灯片之间的重叠。 我想找到共享幻灯片的所有文件对。
对于上面的示例数据,输出如下所示:
SectionFileCandidates
SectionID FileID
527 214
527 223
产生此输出的查询是什么?
是否可以计算一个指标来表明该部分中原始文件幻灯片的比例?
对于上面的示例数据,输出如下所示:
SectionFileCandidates
SectionID FileID Overlap
527 214 1.00
527 223 0.67
...也就是说,文件214的3张幻灯片中的3张位于527部分,文件223的6张幻灯片中的4张位于527部分。
我最初试图使用OVER (PARTITION BY ...)
子句比较行组,但无法弄清楚。
我该如何做这两个查询?
这两个查询都是可能的!
第一个查询:
SELECT s.SectionID,
f.FileID
FROM SectionSlide s
INNER JOIN FileSlide f ON s.SlideID = f.SlideID
GROUP BY s.SectionID, f.FileID
要么
SELECT DISTINCT s.SectionID,
f.FileID
FROM SectionSlide s
INNER JOIN FileSlide f ON s.SlideID = f.SlideID
第二个查询:
select s.SectionID, f.FileID,
round(((count(distinct f.SlideID)*1.0) / aux.total), 2) as 'Overlap'
from SectionSlide s
inner join FileSlide f on f.SlideID = s.SlideID
inner join (select f.FileID, count(f.SlideID) as 'total'
from FileSlide f
group by f.FileID) aux on aux.FileID = f.FileID
group by f.FileID, s.SectionID, aux.total
您的问题让我有些困惑,但是下面的查询应该可以为您带来所需的结果:
SELECT DISTINCT fs.FileId, ss.SectionId
FROM FileSlide fs
INNER JOIN SectionSlide ss
ON fs.SlideId= ss.SlideId
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.