scipy/numpy 中是否有用于获取多项式 PMF 的内置函数?我不确定是否binom
以正确的方式概括,例如
# Attempt to define multinomial with n = 10, p = [0.1, 0.1, 0.8]
rv = scipy.stats.binom(10, [0.1, 0.1, 0.8])
# Score the outcome 4, 4, 2
rv.pmf([4, 4, 2])
这样做的正确方法是什么?谢谢。
scipy/numpy 中是否有用于获取多项式 PMF 的内置函数?我不确定是否binom
以正确的方式概括,例如
# Attempt to define multinomial with n = 10, p = [0.1, 0.1, 0.8]
rv = scipy.stats.binom(10, [0.1, 0.1, 0.8])
# Score the outcome 4, 4, 2
rv.pmf([4, 4, 2])
这样做的正确方法是什么?谢谢。
没有我知道的内置函数,并且二项式概率不会泛化(您需要对一组不同的可能结果进行归一化,因为所有计数的总和必须是 n 不会被处理独立二项式)。但是,实现自己相当简单,例如:
import math
class Multinomial(object):
def __init__(self, params):
self._params = params
def pmf(self, counts):
if not(len(counts)==len(self._params)):
raise ValueError("Dimensionality of count vector is incorrect")
prob = 1.
for i,c in enumerate(counts):
prob *= self._params[i]**counts[i]
return prob * math.exp(self._log_multinomial_coeff(counts))
def log_pmf(self,counts):
if not(len(counts)==len(self._params)):
raise ValueError("Dimensionality of count vector is incorrect")
prob = 0.
for i,c in enumerate(counts):
prob += counts[i]*math.log(self._params[i])
return prob + self._log_multinomial_coeff(counts)
def _log_multinomial_coeff(self, counts):
return self._log_factorial(sum(counts)) - sum(self._log_factorial(c)
for c in counts)
def _log_factorial(self, num):
if not round(num)==num and num > 0:
raise ValueError("Can only compute the factorial of positive ints")
return sum(math.log(n) for n in range(1,num+1))
m = Multinomial([0.1, 0.1, 0.8])
print m.pmf([4,4,2])
>>2.016e-05
我对多项式系数的实现有点幼稚,并且在对数空间中工作以防止溢出。另请注意,n 作为参数是多余的,因为它是由计数的总和给出的(并且相同的参数集适用于任何 n)。此外,由于对于中等 n 或大维度这将很快下溢,因此您最好在日志空间中工作(这里也提供了 logPMF!)