0

Noob 尝试我的第一个负二项式回归。谷歌 Colab 上的 iPython。我将数据集加载为 pandas df。下面公式中的特征(和目标)都出现在 df 中(我将其命名为“数据集”)。

我也带进来

from patsy import dmatrices
import statsmodels.api as sm

然而,当我

formula = """Target ~ MeanAge   + %White + %HHsNotWater + HHsIneq*10    + %NotSaLang + %male + %Informal + COGTACatG2B09 + %Poor + AGRating  """
data = dataset

response, predictors = dmatrices(formula, data, return_type='dataframe')
nb_results = sm.GLM(response, predictors, family=sm.families.NegativeBinomial(alpha=0.15)).fit()
print(nb_results.summary())

我只是得到AssertionError:, 和一个指向第四行的箭头(开始“响应”的那个)。我不知道如何解决这个问题,也无法在这个网站上找到类似的问题 - 请提供任何明智的指导?

4

1 回答 1

1

...我犯的错误是在公式行中。Python 将我的功能名称中的“%”和“*”视为完全不同的指令。

因此,将每个功能从 HHsHotWater 更改为 Q('HHsNotWater') 等,一切都不同了。@njsmith 在 pydata/patsy 问题 github 上让我直截了当。

于 2019-06-12T08:16:12.747 回答