1

我得到了以下R代码,我需要将它转换为python并在python环境中运行它,基本上我已经用rpy2模块完成了这个,但是python做同样的事情看起来有点乏味,所以有人能找到更好的方法用 rpy2 模块将以下 R 代码重写为等效的 python 脚本?

mymad <- function (x) 
{
    center <- median(x)
    y <- abs(x - center)
    n <- length(y)
    if (n == 0) 
        return(NA)
    half <- (n + 1)/2
    1.4826 * if (n%%2 == 1) {
        sort(y, partial = half)[half]
    }
    else {
        sum(sort(y, partial = c(half, half + 1))[c(half, half + 
            1)])/2
    }
}
4

3 回答 3

7

您可以说明函数的目的,即Median Absolute Deviation。您所说mymad的是基于正态分布变量的大样本假设的总体标准偏差的近似值。

根据这个网站

def median(pool):
    copy = sorted(pool)
    size = len(copy)
    if size % 2 == 1:
        return copy[(size - 1) / 2]
    else:
        return (copy[size/2 - 1] + copy[size/2]) / 2

因此,您需要一个mad可以验证的功能:

mad(x) == median(abs(x-median(x)))

感谢 Elenaher(给出他的评论),这里是代码:

def mad(x):
    return median([abs(val-median(x)) for val in x])

然后,我相信您正在计算:

def mymad(x):
    return 1.4826*mad(x)
于 2010-08-05T16:11:30.383 回答
3

可能比 numpy/Python 编写的慢一点,但实现起来肯定更快(因为没有轮子被重新发明):

# requires rpy2 >= 2.1
from rpy2.robjects.packages import importr
stats = importr('stats')

stats.mad(x)
于 2010-08-06T20:34:48.600 回答
2
import numpy
# x is the input array
x = numpy.array( [1,2,4,3,1,6,7,5,4,6,7], float ) }
# mad = median( | x - median(x) | )
mad =  numpy.median( numpy.abs( ( x - numpy.median( x ) ) )
于 2014-03-18T13:23:45.467 回答