2

我正在对按年份细分的抵押贷款数据面板进行回归。所有变量都是分类的虚拟变量。在某些年份,抵押贷款的某些特征或特征可能在其他年份不存在,因此我收到如下所示的 Patsy 错误:

 PatsyError: Error converting data to categorical: observation with value 'Null/Invalid' does not match any of the expected levels (expected: ['Conventional', 'FHA', 'Other Non-Government Loan', 'VA'])
net_gnma_rate ~ C(origination_month) + C(Mortgage_FICO_Bins, Treatment("(720, 900]")) * C(Mortgage_LTV_Bins, Treatment("(0, 80]")) + C(alt_loantype, Treatment("Conventional")) + C(conforming_mtge, Treatment("conforming")) + C(alt_lien, Treatment("1st Lien")) + C(doctype, Treatment("Full Documentation")) + C(alt_occ, Treatment("Owner Occupied")) + C(altpmi3, Treatment("No PMI")) + C(units, Treatment("1 unit"))

有什么方法可以在 StatsModels 预测工具的构造中插入不存在变量的 beta 系数,最好是前一年的一个。因此,例如:

   Variable      Beta 2011  Beta 2012       Count 2012        Count 2013
   Loan Type A      -.05      -.08             2000              800
   Loan Type B      -.22      -.25             1000              1500  
   Loan Type C      -.38                                         500

如果我做了 model2012.predict(data2013),则会出现错误,因为 2013 年有 C 类贷款的观察值和回归量,但 2012 年没有。但是,我想在预测中假设 C 类贷款的 2011 年贝塔系数使用 2012 年参数的 2013 年数据。

如何实现?任何投入将不胜感激。

4

0 回答 0