[英]Efficient query for only the first N rows for each unique ID
这是此问题的后续措施。
TLDR:
问题:
我想过滤查询以仅保留每个唯一ID的前n行。
答案:
query = query.GroupBy(q => q.ID).SelectMany(g => g.Take(n));
这个答案的问题在于,对于80,000多个行,评估查询所需的时间比通过迭代进行过滤( foreach
)的时间要长得多(至少慢两倍)。 查看此答案生成的SQL,使用CROSS APPLY
,最有可能用于SelectMany()
。
该链接描述了CROSS APPLY
作用:
APPLY运算符允许您联接两个表表达式; 每次对左表表达式中的每一行都处理右表表达式。
简而言之,我正在寻找一个过滤查询,该查询可以有效地收集每个唯一ID
的前N
行。
具有说明性SQL的Linq解决方案将是理想的选择。
我在这里的 SQL中找到了答案(底部是SQL 2000解决方案),并设法实现了Queryable / Linq版本:
query = tableQueryable.Where(a =>
tableQueryable.Where(b => b.ID == a.ID)
.OrderByDescending(o => o.Timestamp)
.Take(N)
.Select(s => s.PK)
.Contains(a.PK)
).OrderByDescending(d => d.Timestamp);
一个相当标准的“子查询”模式。 在大桌子上,速度要快得多。
L2S没有行号,因此无法使用马丁的把戏。 我也曾经遇到过这个问题,据我所知,这是最佳的L2S解决方案(不以任何方式使用本机SQL)。
您可以尝试将所有结果下拉到应用程序中,然后在其中执行行号操作。 这可能会损害性能或提高性能。 它是哪一个取决于具体情况。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.