csv - 在开始或结束时更好地过滤数据流？

Question

我正在处理一个需要处理大量（数 GB）逗号分隔值 (CSV) 文件的项目。

我基本上做的事情如下：

我想知道在源端进行过滤是否会更好，例如，每个侦听器都有一个关联的 Predicate 对象，该对象确定是否应将给定的数据分派给侦听器，在这种情况下，流程看起来更像

净效果是一样的，只是过滤发生在哪里的问题。

（同样，我拥有一次处理一个条目的这种“数据流”的唯一原因是因为我正在处理千兆字节的 CSV 文件，并且我无法创建集合、过滤它，然后再处理它 - 我需要随时过滤）

score 2 · Accepted Answer

除非调用侦听器的成本很大（Remoting、WCF、...），否则我会保留一个非常简单的界面，让侦听器决定如何处理该行。

1 回答 1