1

我想计算一些数据(包括NaN)的几何平均值,我该怎么做?

我知道如何用 NaN 计算平均值,我们可以使用以下代码:

import numpy as np
M = np.nanmean(data, axis=2).

那么如何使用geomean呢?

4

1 回答 1

2

您可以使用身份(我只在德语维基百科中找到它,但可能还有其他来源):

在此处输入图像描述

这个恒等式可以使用几何平均值的正常定义上的“对数规则”来构造:

在此处输入图像描述

a可以任意选择基数,因此您可以使用(np.lognp.exp作为逆运算):

import numpy as np

def nangmean(arr, axis=None):
    arr = np.asarray(arr)
    inverse_valids = 1. / np.sum(~np.isnan(arr), axis=axis)  # could be a problem for all-nan-axis
    rhs = inverse_valids * np.nansum(np.log(arr), axis=axis)
    return np.exp(rhs)

它似乎有效:

>>> l = [[1, 2, 3], [1, np.nan, 3], [np.nan, 2, np.nan]]

>>> nangmean(l)  
1.8171205928321397

>>> nangmean(l, axis=1)  
array([ 1.81712059,  1.73205081,  2.        ])

>>> nangmean(l, axis=0)  
array([ 1.,  2.,  3.])

在 NumPy 1.10 中也np.nanprod添加了,所以你也可以使用正常的定义:

import numpy as np

def nangmean(arr, axis=None):
    arr = np.asarray(arr)
    valids = np.sum(~np.isnan(arr), axis=axis)
    prod = np.nanprod(arr, axis=axis)
    return np.power(prod, 1. / valids)
于 2017-06-04T10:07:13.377 回答