我有一个数据集,格式为
频率、方向、归一化功率谱密度、扩散、偏度、峰度
我可以使用scipy 中偏态正态分布的最佳答案中的代码来可视化特定记录的分布,但我不确定如何将峰度值应用于分布?
from scipy import linspace
from scipy import pi,sqrt,exp
from scipy.special import erf
from pylab import plot,show
def pdf(factor, x):
return (100*factor)/sqrt(2*pi) * exp(-x**2/2)
def cdf(x):
return (1 + erf(x/sqrt(2))) / 2
def skew(x,e=0,w=1,a=0, norm_psd=1):
t = (x-e) / w
return 2 / w * pdf(norm_psd, t) * cdf(a*t)
n = 540
e = 341.9 # direction
w = 59.3 # spread
a = 3.3 # skew
k = 4.27 # kurtosis
n_psd = 0.5 # normalised power spectral density
x = linspace(-90, 450, n)
p = skew(x, e, w, a, n_psd)
print max(p)
plot(x,p)
show()
编辑:我从我的标题中删除了偏斜正态,因为我认为实际上不可能将峰度值应用于上述分布,我认为需要不同的分布,因为涉及方向,循环统计的分布可能更合适?
感谢下面的答案,我可以使用下面代码中演示的 pdf_mvsk 函数应用峰度,不幸的是,我的偏斜值导致了负 y 值,但答案满足了我的问题。
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.sandbox.distributions.extras as extras
pdffunc = extras.pdf_mvsk([341.9, 59.3, 3.3, 4.27])
range = np.arange(0, 360, 0.1)
plt.plot(range, pdffunc(range))
plt.show()