python - 使用 scipy 在 Python 中的多元正态 CDF

Question

为了计算多元正态的 CDF，我遵循了这个例子（对于单变量情况），但无法解释 scipy 产生的输出：

from scipy.stats import norm
import numpy as np
mean = np.array([1,5])
covariance = np.matrix([[1, 0.3 ],[0.3, 1]])
distribution = norm(loc=mean,scale = covariance)
print distribution.cdf(np.array([2,4]))

产生的输出是：

[[  8.41344746e-01   4.29060333e-04]
 [  9.99570940e-01   1.58655254e-01]]

如果联合 CDF 定义为：

P (X1 ≤ x1, . . . ,Xn ≤ xn)

那么预期的输出应该是一个介于 0 和 1 之间的实数。

score 21 · Accepted Answer

经过大量搜索后，我认为Noah H. Silbert 的这篇博客文章描述了标准库中唯一现成的代码，可用于在 Python 中计算多变量法线的 cdf。Scipy 有办法做到这一点，但正如博客中提到的那样，很难找到。该方法基于 Alan Genz 的一篇论文。

从博客中，这就是它的工作原理。

from scipy.stats import mvn
import numpy as np
low = np.array([-10, -10])
upp = np.array([.1, -.2])
mu = np.array([-.3, .17])
S = np.array([[1.2,.35],[.35,2.1]])
p,i = mvn.mvnun(low,upp,mu,S)
print p

0.2881578675080012

score 11 · Accepted Answer

v1.1.0的 scipymultivariate_normal现在内置了一个 cdf 函数：

from scipy.stats import multivariate_normal as mvn
import numpy as np

mean = np.array([1,5])
covariance = np.array([[1, 0.3],[0.3, 1]])
dist = mvn(mean=mean, cov=covariance)
print("CDF:", dist.cdf(np.array([2,4])))

CDF: 0.14833820905742245

文档可以在这里找到。

score 0 · Accepted Answer

如果您不关心性能（即仅偶尔执行），那么您可以使用创建多元正态 pdf multivariate_normal，然后通过计算 cdfintegrate.nquad

python - 使用 scipy 在 Python 中的多元正态 CDF

3 回答 3

Related

Reference