[英]How does IEnumerable<T> work in background
我正在徘徊IEnumerable<T>
接口的更深入的功能。
基本上,它作为执行中的中间步骤。 例如,如果你写:
IEnumerable<int> temp = new int[]{1,2,3}.Select(x => 2*x);
在使用temp进行某些操作(例如List<int> list = temp.ToList()
)之前,不会计算(枚举) Select
函数的结果。
然而,让我感到困惑的是,由于IEnumerable<T>
是一个接口,根据定义,它不能被实例化。 那么,实际项目(在示例2*x
项目中)所在的集合是什么?
而且,如果我们要编写IEnumerable<int> temp = Enumerable.Repeat(1, 10);
,什么是存储1s的底层集合(数组,列表,其他东西)?
我似乎无法找到关于此接口的实际实现及其功能的全面(更深入)解释(例如,如果存在底层集合, yield
关键字如何工作)。
基本上,我要求的是对IEnumerable<T>
的功能进行更详细的解释。
实施无关紧要。 所有这些(LINQ)方法都返回IEnumerable<T>
,接口成员是您可以访问的唯一成员,这应该足以使用它们。
但是,如果您真的必须知道,可以在http://sourceof.net上找到实际的实现。
但是,对于某些方法,您将无法找到显式类声明,因为其中一些使用yield return
,这意味着编译期间编译器会生成正确的类(带状态机)。 例如Enumerable.Repeat
就是这样实现的:
public static IEnumerable<int> Range(int start, int count) {
long max = ((long)start) + count - 1;
if (count < 0 || max > Int32.MaxValue)
throw Error.ArgumentOutOfRange("count");
return RangeIterator(start, count);
}
static IEnumerable<int> RangeIterator(int start, int count) {
for (int i = 0; i < count; i++)
yield return start + i;
}
您可以在MSDN上阅读更多相关信息: 迭代器(C#和Visual Basic)
并非所有实现IEnumerable
对象都以某种方式延迟执行。 接口的API 可以延迟执行,但它不需要它。 同样的实现不会以任何方式推迟执行。
那么,实际项目(在示例2 * x项目中)所在的集合是什么?
空无一人。 每当请求下一个值它计算的是需求一个价值,它给调用者,然后忘记了价值。 它不会将其存储在任何其他地方。
而且,如果我们要编写
IEnumerable<int> temp = Enumerable.Repeat(1, 10);
,什么是存储1s的底层集合(数组,列表,其他东西)?
没有一个。 当你要求下一个值时 ,它会立即计算每个新值,之后就不会记住它。 它只存储足够的信息以便能够计算下一个值,这意味着它只需要存储元素和剩余产生的值的数量。
虽然实际的.NET实现将使用更简洁的方法来创建这样的类型,但创建一个延迟执行的枚举并不是特别困难。 这样做即使是漫长的道路也比艰难更乏味。 您只需计算迭代器的MoveNext
方法中的下一个值。 在你问的例子中, Repeat
,这很容易,因为你只需要计算是否有另一个值,而不是它是什么:
public class Repeater<T> : IEnumerator<T>
{
private int count;
private T element;
public Repeater(T element, int count)
{
this.element = element;
this.count = count;
}
public T Current { get { return element; } }
object IEnumerator.Current
{
get { return Current; }
}
public void Dispose() { }
public bool MoveNext()
{
if (count > 0)
{
count--;
return true;
}
else
return false;
}
public void Reset()
{
throw new NotSupportedException();
}
}
(我省略了一个只返回此类型的新实例的IEnumerable
类型,或者一个静态Repeat
方法,它创建了一个可枚举的新实例。没有什么特别有趣的东西可以看到。)
一个稍微有趣的例子就像Count
:
public class Counter : IEnumerator<int>
{
private int remaining;
public Counter(int start, int count)
{
Current = start;
this.remaining = count;
}
public int Current { get; private set; }
object IEnumerator.Current
{
get { return Current; }
}
public void Dispose() { }
public bool MoveNext()
{
if (remaining > 0)
{
remaining--;
Current++;
return true;
}
else
return false;
}
public void Reset()
{
throw new NotSupportedException();
}
}
在这里,我们不仅计算我们是否有另一个值,而是每次为我们请求新值时,下一个值是什么。
那么,实际项目(在示例2 * x项目中)所在的集合是什么?
它不在任何地方。 迭代时会有“按需”生成单个项目的代码,但不会预先计算2*x
数字。 除非您调用ToList
或ToArray
,否则它们也不会存储在任何位置。
而且,如果我们要编写IEnumerable temp = Enumerable.Repeat(1,10);那么存储1s的底层集合(数组,列表,其他东西)是什么?
同样的图片在这里: IEnumerable
的返回实现不是公共的,它按需返回其项目,而不将它们存储在任何地方。
C#编译器提供了一种实现IEnumerable
的便捷方式,而无需为其定义类。 您所需要的只是将方法返回类型声明为IEnumerable<T>
,并根据需要使用yield return
来提供值。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.