2

假设我们有两个数组:

DateTime[] wDates = new DateTime[20000];
double[] wValues = new double[20000];

这两个数组都是按顺序排列的,即给定一个 int i,wValues[i] 用于日期 wDates[i]。

假设我们需要获取 wValues 的平均值,其中日期的月份是一月

使用标准循环,这将是:

double wAvg = 0.0;
int wDataCount = 0;
for (int i=0; i < 20000; i++)
  if (wDates[i].Month == 1)
  {
    wAvg += wValues[i];
    wDataCount++;
  }

if (wDataCount > 0)
  wAvg /= wDataCount;

我想知道如何在 LINQ 中执行此操作?我可以创建一个包含两个值的结构/类 DateDouble,然后执行以下操作:

List<DateDouble> wListData = new List<DateDouble>();
Add the items...
double wAvg = (from d in wListData
               where d.Date.Month == 1
               select d.Value).Average();

但是当每天完成数千万次时,创建数千个 DateDouble 对象将是一个很大的内存开销。临时对象也会发生同样的情况,尝试使用“索引”并在数组上加入索引会产生糟糕的性能。

有没有更好的方法在 LINQ 中实现这一点?

谢谢,MM

4

3 回答 3

3

好吧,您可以使用Zip运算符使事情变得更简单:

var average = wDates.Zip(wValues, (date, value) => new { date, value })
                    .Where(pair => pair.date.Month == 1)
                    .Average(pair => pair.value);

这仍然会为每对创建一个匿名类型的实例,但我个人会放弃它并在您认为它太昂贵之前测量性能。请注意,这将以流方式运行 - 因此尽管会产生大量垃圾,但任何时候所需的总内存都很小。

您可以通过创建自己的 pair结构来提高效率......这将避免创建额外的对象,但这会更痛苦。不过还不错

// The normal Tuple types are classes.
public struct TupleValue<T1, T2>
{
    private readonly T1 item1;
    private readonly T2 item2;

    public T1 Item1 { get { return item1; } }
    public T2 Item2 { get { return item2; } }

    public TupleValue(T1 item1, T2 item2)
    {
        this.item1 = item1;
        this.item2 = item2;
    }
}

var average = wDates.Zip(wValues, (date, value) => 
                                   new TupleValue<DateTime, double>(date, value))
                    .Where(pair => pair.Item1.Month == 1)
                    .Average(pair => pair.Item2);

我只会在证明第一种方法很昂贵之后才会这样做。

于 2012-05-17T16:08:49.207 回答
2

IEnumerable.Where() 扩展方法有一个重载版本,它也考虑谓词中的索引。

double average = wValues.Where((d, i) => wDates[i].Month == 1).Average();
于 2012-05-17T17:13:37.153 回答
0

就像是:

double wAvg = wDates.Select((d,i) => new { Month = d.Month, Index = i })
                    .Where(x => x.Month == 1)
                    .Select(x => wValues[i])
                    .Average();

无论如何,在这种情况下,您还将创建该匿名类型的 N 个实例。

于 2012-05-17T16:15:39.357 回答