8

在金融领域,我们通常需要从一个时间序列数据流中计算出移动窗口聚合值,以移动平均为例,假设我们有以下数据流(T是时间戳,V是实际值):

[T0,V0],[T1,V1],[T2,V2],[T3,V3],[T4,V4],[T5,V5],[T6,V6],[T7,V7],[T8,V8],[T9,V9],[T10,1V0],......

从我们得到的流中计算移动平均值 3:

avg([T0,V0],[T1,V1],[T2,V2]),
avg([T1,V1],[T2,V2],[T3,V3]),
avg([T2,V2],[T3,V3],[T4,V4]),
avg([T3,V3],[T4,V4],[T5,V5]),
avg([T4,V4],[T5,V5],[T6,V6]),...

要计算移动平均线,我们似乎可以这样做:

  1. 从原始流构建一个 Observable
  2. 通过将值聚合到组中,从原始流构建一个 Observable
  3. 在步骤 2 中使用聚合运算符计算 Observable 的最终结果。

步骤 1 和 3 实现起来很简单,但是,对于步骤 2,当前的 RxJava 似乎没有内置运算符来生成移动窗口组,window/groupBy 运算符似乎不适合这种情况,我没有找到一种从现有运营商组成解决方案的简单方法,有人可以建议如何在 RxJava 中以“优雅”的方式做到这一点吗?

4

2 回答 2

6

RxJava 版本:0.15.1

import java.util.List;                                                          
import rx.Observable;                                                           
import rx.util.functions.Action1;                                               
                                                                                
class Bar {                                                                     
                                                                                
    public static void main(String args[]) {                                    
                                                                                
        Integer arr[] = {1, 2, 3, 4, 5, 6}; // N = 6                            
        Observable<Integer> oi = Observable.from(arr);                          
                                                                                
        // 1.- bundle 3, skip 1                                                 
        oi.buffer(3, 1)                                                         
        /**                                                                     
         * 2.- take only the first X bundles                                    
         * When bundle 3, X = N - 2 => 4                                        
         * When bundle 4, X = N - 3 => 3                                        
         * When bundle a, X = N - (a-1)                                         
         */                                                                     
          .take(4)                                                              
        // 3.- calculate average                                                
          .subscribe(new Action1<List<Integer>>() {                             
            @Override                                                           
            public void call(List<Integer> lst) {                               
                int sum = 0;                                                    
                for(int i = 0; i < lst.size(); i++) {                           
                    sum += lst.get(i);                                          
                }                                                               
                                                                                
                System.out.println("MA(3) " + lst +                             
                                   " => " + sum / lst.size());                  
            }                                                                   
        });                                                                     
                                                                                
    }                                                                           
                                                                                
}  

样本输出:

MA(3) [1, 2, 3] => 2

MA(3) [2, 3, 4] => 3

MA(3) [3, 4, 5] => 4

MA(3) [4, 5, 6] => 5

于 2013-12-28T08:53:40.127 回答
2

我会这样做:

public static Observable<Double> movingAverage(Observable<Double> o, int N) {
    return o.window(N, 1).flatMap(
        new Func1<Observable<Double>, Observable<Double>>() {
            public Observable<Double> call(Observable<Double> window) {
                return Observable.averageDoubles(window);
            }
        }
    );
}
  • 我使用window(它发出 Observables,它只消耗恒定数量的内存)而不是buffer(它发出 Lists,它为每个项目消耗内存)。
  • 这是一个如何使用组合运算符而不是编写自己的循环的示例,这是在使用 Observables 时应该始终考虑的事情。

更新:如果你想在流的末尾过滤掉元素少于n元素的窗口,你可以这样做:

def movingAverage(o: Observable[Double], n: Int): Observable[Double] = {
  class State(val sum: Double, val n: Int)
  o.window(n, 1).flatMap(win => 
    win.foldLeft(new State(0.0, 0))((s, e) => new State(s.sum + e, s.n + 1))
       .filter(s => s.n == n)
       .map(s => s.sum/s.n))
}

(我选择 Scala 是因为它写起来更短,但在 Java 中,你也可以这样做,只需注意 ScalafoldLeft是在 Java 中调用reduce的)。

于 2014-01-04T22:20:16.340 回答