字典中的前100个值 <string, int> -为什么LinQ比foreach循环快得多

Question

我正在编写一个简单的应用程序，以分析巨大的textfile（60gb）并存储所有单词以及它出现在文件中的时间。 为了测试起见，我将文件切成2gb。

我发现字典中的单词和计数虽然很难相信我所看到的结果。

词典中的单词总数：1128495

我正在使用的代码：

sw.Start();

StringBuilder sb = new StringBuilder();
sb.AppendFormat("<html><head></head><body>");
lock (Container.values)
{
    int i = int.Parse(ctx.Request.QueryString["type"]);
    switch (i)
    {
        case 1: //LinQ
            var values = Container.values.OrderByDescending(a => a.Value.Count).Take(100);
            foreach (var value in values)
            {
                sb.AppendFormat("{0} - {1}<br />", value.Key, value.Value.Count);
            }
            break;
        case 2: //Foreach
            foreach (var y in Container.values)
            {

            }
            break;
        case 3: //For
            for (int x = 0; x < Container.values.Count; x++)
            {

            }
            break;
    }                
}
sw.Stop();
sb.AppendFormat("<br /><br /> {0}", sw.ElapsedMilliseconds);
sb.AppendFormat("</body>");

跑两次，下面的速度以毫秒为单位：

LinQ：＃1：598，＃2 609

Foreach：＃1 1000，＃1020

为什么LinQ比foreach更快？ 我认为LinQ必须循环遍历Dictionary本身，因此它如何进行+如此及时地将其排序？

编辑：编译为发布模式后，结果如下：LinQ：796（较慢？）foreach：945

该应用程序是一个简单的控制台应用程序，代码在HttpListener中执行

编辑2：我设法弄清楚了问题所在。 当我初始化字典时，我将其容量设置为89000000（在处理60gb文件时，否则将抛出OutOfMemory异常）。 由于某种原因，这会大大降低foreach循环的性能。 如果将容量设置为1128495，则foreach循环将在56毫秒内执行。

为什么会这样呢？ 如果将计数器放在循环中，即使容量为89000000，它也只能运行1128495次。

Answer 1

编译器通过调用GetEnumerator（），然后在枚举器上重复调用MoveNext和Current，来实现foreach循环。 LINQ的OrderByDescending通常以完全相同的方式工作，它基本上进行了foreach提取所有元素，然后对其进行排序。

快速浏览ILSpy可以发现，OrderByDescending将容器放入名为Buffer<T>的内部类型中，该类型具有优化：如果容器实现ICollection<T> ，则它使用ICollection<T>.CopyTo而不是foreach循环。 通常，OrderByDescending仍不会比foreach循环快，因为提取元素后必须对其进行排序。

您是否在foreach循环中遗漏了可能解释其速度较慢的代码？ 如果您确实使用了空的foreach循环，则可能是由于Container.values的IEnumerator<T>类型（或GetEnumerator方法）与其CopyTo方法相比速度较慢。

Answer 2

您的LINQ版本仅需要前100个元素！

删除.Take(100)以便进行比较！

字典中的前100个值 <string, int> -为什么LinQ比foreach循环快得多

问题描述

2 个解决方案

解决方案1
4 已采纳 2012-01-07 20:43:57

解决方案2
0 2012-01-07 20:34:04

字典中的前100个值 <string, int> -为什么LinQ比foreach循环快得多

问题描述

2 个解决方案

解决方案1 4 已采纳 2012-01-07 20:43:57

解决方案2 0 2012-01-07 20:34:04

解决方案1
4 已采纳 2012-01-07 20:43:57

解决方案2
0 2012-01-07 20:34:04