3

我有一个数据集,格式为

频率、方向、归一化功率谱密度、扩散、偏度、峰度

我可以使用scipy 中偏态正态分布的最佳答案中的代码来可视化特定记录的分布,但我不确定如何将峰度值应用于分布?

from scipy import linspace
from scipy import pi,sqrt,exp
from scipy.special import erf
from pylab import plot,show

def pdf(factor, x):
    return (100*factor)/sqrt(2*pi) * exp(-x**2/2)

def cdf(x):
    return (1 + erf(x/sqrt(2))) / 2

def skew(x,e=0,w=1,a=0, norm_psd=1):
    t = (x-e) / w
    return 2 / w * pdf(norm_psd, t) * cdf(a*t)

n = 540
e = 341.9 # direction
w = 59.3 # spread
a = 3.3 # skew
k = 4.27 # kurtosis
n_psd = 0.5 # normalised power spectral density
x = linspace(-90, 450, n) 


p = skew(x, e, w, a, n_psd)
print max(p)
plot(x,p)
show()

编辑:我从我的标题中删除了偏斜正态,因为我认为实际上不可能将峰度值应用于上述分布,我认为需要不同的分布,因为涉及方向,循环统计的分布可能更合适?

感谢下面的答案,我可以使用下面代码中演示的 pdf_mvsk 函数应用峰度,不幸的是,我的偏斜值导致了负 y 值,但答案满足了我的问题。

import numpy as np
import matplotlib.pyplot as plt
import statsmodels.sandbox.distributions.extras as extras

pdffunc = extras.pdf_mvsk([341.9, 59.3, 3.3, 4.27])
range = np.arange(0, 360, 0.1)
plt.plot(range, pdffunc(range))
plt.show()
4

1 回答 1

7

如果您有均值、标准差、偏斜和峰度,那么您可以使用 Gram-Charlier 展开来构建具有这些矩的近似正态分布。

前段时间我对此进行了调查, scipy.stats 有一个错误的功能并被删除。

我不记得这是什么状态,因为很久以前我把它放在 statsmodels 沙箱 http://statsmodels.sourceforge.net/devel/generated/statsmodels.sandbox.distributions.extras.pdf_mvsk .html#statsmodels.sandbox.distributions.extras.pdf_mvsk

于 2012-05-30T17:37:26.217 回答