4

我正在尝试实现逻辑多项式回归(AKA softmax 回归)。在这个例子中,我试图对 iris 数据集进行分类

我在指定模型时遇到问题,我得到一个优化错误find_MAP()。如果我避免使用find_MAP(),如果我使用 aCategorical作为可能性,我会得到一个所有零向量的“样本”,或者如果我使用 ,则后验与先验完全相同Mutinomial(n=1, p=p)

import pymc3 as pm
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

iris = sns.load_dataset("iris")
y_2 = pd.Categorical(iris['species']).labels
x_n = iris.columns[:-1]
x_2 = iris[x_n].values
x_2 = (x_2 - x_2.mean(axis=0))/x_2.std(axis=0)
indice = list(set(y_2))

with pm.Model() as modelo_s:

    alfa = pm.Normal('alfa', mu=0, sd=100, shape=3)
    beta = pm.Normal('beta', mu=0, sd=100, shape=(4,3))

    mu = (alfa[indice] + pm.dot(x_2, beta[:,indice])).T
    p = pm.exp(mu)/pm.sum(pm.exp(mu), axis=0)

    yl = pm.Categorical('yl', p=p, observed=y_2)
    #yl = pm.Multinomial('yl', n=1, p=p, observed=y_2)

    start = pm.find_MAP()
    step = pm.Metropolis()
    trace_s = pm.sample(1000, step, start)
4

1 回答 1

0

问题可能是缺少向量值变量的 gibbs 更新。因此,仅当所有二进制值都产生良好的 logp 时才接受跳转。此 PR 可能会有所帮助:#799

所以你可以试试:pip install git+ https://github.com/pymc-devs/pymc3@gibbs然后做 Metropolis(gibbs='random')。

于 2016-02-15T09:43:07.463 回答