正如他们所说,魔鬼在细节中......
两种集合枚举方法的最大区别是foreach
带状态,ForEach(x => { })
而不带。
但是让我们再深入一点,因为有些事情您应该注意会影响您的决定,并且在为任何一种情况编码时都应该注意一些警告。
让我们List<T>
在我们的小实验中使用来观察行为。对于这个实验,我使用的是 .NET 4.7.2:
var names = new List<string>
{
"Henry",
"Shirley",
"Ann",
"Peter",
"Nancy"
};
让我们先迭代一下foreach
:
foreach (var name in names)
{
Console.WriteLine(name);
}
我们可以将其扩展为:
using (var enumerator = names.GetEnumerator())
{
}
拿着枚举器,我们得到:
public List<T>.Enumerator GetEnumerator()
{
return new List<T>.Enumerator(this);
}
internal Enumerator(List<T> list)
{
this.list = list;
this.index = 0;
this.version = list._version;
this.current = default (T);
}
public bool MoveNext()
{
List<T> list = this.list;
if (this.version != list._version || (uint) this.index >= (uint) list._size)
return this.MoveNextRare();
this.current = list._items[this.index];
++this.index;
return true;
}
object IEnumerator.Current
{
{
if (this.index == 0 || this.index == this.list._size + 1)
ThrowHelper.ThrowInvalidOperationException(ExceptionResource.InvalidOperation_EnumOpCantHappen);
return (object) this.Current;
}
}
两件事变得显而易见:
- 我们返回一个对底层集合有深入了解的有状态对象。
- 集合的副本是浅拷贝。
这当然不是线程安全的。正如上面所指出的,在迭代时更改集合只是不好的魔力。
但是,在迭代期间通过我们之外的方式在迭代期间对集合进行处理而导致集合变得无效的问题呢?最佳实践建议在操作和迭代期间对集合进行版本控制,并检查版本以检测底层集合何时更改。
这就是事情变得非常模糊的地方。根据微软文档:
如果对集合进行了更改,例如添加、修改或删除元素,则枚举器的行为是未定义的。
嗯,那是什么意思?举例来说,仅仅因为List<T>
实现了异常处理并不意味着所有实现IList<T>
的集合都会这样做。这似乎明显违反了 Liskov 替换原则:
超类的对象应该可以用它的子类的对象替换而不破坏应用程序。
另一个问题是枚举器必须实现IDisposable
——这意味着潜在内存泄漏的另一个来源,不仅是调用者弄错了,而且如果作者没有Dispose
正确实现该模式。
最后,我们有一个生命周期的问题......如果迭代器是有效的,但是底层的集合已经消失了怎么办?我们现在是什么的快照......当你将集合的生命周期和它的迭代器分开时,你是在自找麻烦。
现在让我们检查一下ForEach(x => { })
:
names.ForEach(name =>
{
});
这扩展为:
public void ForEach(Action<T> action)
{
if (action == null)
ThrowHelper.ThrowArgumentNullException(ExceptionArgument.match);
int version = this._version;
for (int index = 0; index < this._size && (version == this._version || !BinaryCompatibility.TargetsAtLeast_Desktop_V4_5); ++index)
action(this._items[index]);
if (version == this._version || !BinaryCompatibility.TargetsAtLeast_Desktop_V4_5)
return;
ThrowHelper.ThrowInvalidOperationException(ExceptionResource.InvalidOperation_EnumFailedVersion);
}
重要的注意事项如下:
for (int index = 0; index < this._size && ... ; ++index)
action(this._items[index]);
此代码不分配任何枚举器(没有分配给),并且在迭代时Dispose
不会暂停。
请注意,这也会执行底层集合的浅拷贝,但该集合现在是时间快照。如果作者没有正确实施对集合更改或“陈旧”的检查,则快照仍然有效。
这绝不会保护您免受生命周期问题的影响...如果基础集合消失了,您现在有一个浅拷贝,指向什么...但至少您没有Dispose
问题处理孤立的迭代器...
是的,我说的是迭代器……有时拥有状态是有利的。假设您想维护类似于数据库游标的东西……也许多foreach
样式Iterator<T>
是要走的路。我个人不喜欢这种设计风格,因为有太多的终生问题,而且你依赖于你所依赖的集合的作者的好意(除非你真的从头开始写所有东西)。
总有第三种选择...
for (var i = 0; i < names.Count; i++)
{
Console.WriteLine(names[i]);
}
它不性感,但它有牙齿(向汤姆克鲁斯和电影The Firm道歉)
这是你的选择,但现在你知道了,它可以成为一个知情的人。