0

这是我的问题:我有一个包含数据的二维矩阵。数据是高斯的,我需要找出哪些数据点是极端数据点。作为第一个估计,值 > (µ + 3 sigma) 应该没问题。只是为了确定我是否正确执行以下操作:我可以将数据添加到累加器,我能够计算 µ,但我怎样才能得到 f** sigma?

4

1 回答 1

1

你可以从累加器中得到平均值和矩:

#include <iostream>
#include <boost/accumulators/accumulators.hpp>
#include <boost/accumulators/statistics/stats.hpp>
#include <boost/accumulators/statistics/mean.hpp>
#include <boost/accumulators/statistics/moment.hpp>
using namespace boost::accumulators;

int main()
{
    // Define an accumulator set for calculating the mean and the
    // 2nd moment ...
    accumulator_set<double, stats<tag::mean, tag::moment<2> > > acc;

    // push in some data ...
    acc(1.2);
    acc(2.3);
    acc(3.4);
    acc(4.5);

    // Display the results ...
    std::cout << "Mean:   " << mean(acc) << std::endl;
    std::cout << "Moment: " << accumulators::moment<2>(acc) << std::endl;

    return 0;
}

然而,在 boost 文档中,我们读到这是原始时刻(不是中心时刻):

计算样本的 N 阶矩,定义为样本的 N 次方与样本计数的总和。

所以你需要调整它,这里是如何做到的(你需要第二个中心矩的 sqrt,mi_2)。 http://en.wikipedia.org/wiki/Moment_(数学)

于 2013-09-18T08:32:54.033 回答