3

我的问题与计算通过 Stata 中的 Weibull 回归估计的系数得出的转换概率的标准差 (SD) 有关。

转换概率被用于模拟白血病患者在 40 个 90 天(约 10 年)周期内的疾病进展。我需要概率的 SD(随着马尔可夫模型的运行而变化)来创建 beta 分布,其参数可以使用相应的马尔可夫循环概率及其 SD 来近似。然后使用这些分布进行概率敏感性分析,即用它们代替简单概率(每个周期一个),从中随机抽取可以评估模型成本效益结果的稳健性。

无论如何,使用事件生存时间数据,我使用回归分析来估计可以插入方程以生成转移概率的系数。例如...

. streg, nohr dist(weibull)

        failure _d:  event
   analysis time _t:  time

Fitting constant-only model:

Iteration 0:   log likelihood = -171.82384
Iteration 1:   log likelihood = -158.78902
Iteration 2:   log likelihood = -158.64499
Iteration 3:   log likelihood = -158.64497
Iteration 4:   log likelihood = -158.64497

Fitting full model:
Iteration 0:   log likelihood = -158.64497  

Weibull regression -- log relative-hazard form 

No. of subjects =           93                     Number of obs   =        93
No. of failures =           62
Time at risk    =        60250
                                                   LR chi2(0)      =     -0.00
Log likelihood  =   -158.64497                     Prob > chi2     =         .

------------------------------------------------------------------------------
          _t |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------
-------------+------
       _cons |  -4.307123   .4483219    -9.61   0.000    -5.185818   -3.428429
-------------+----------------------------------------------------------
-------------+------
       /ln_p |  -.4638212   .1020754    -4.54   0.000    -.6638854    -.263757
-------------+----------------------------------------------------------
-------------+------
           p |    .628876   .0641928                      .5148471    .7681602
         1/p |   1.590139   .1623141                      1.301812    1.942324

然后,我们使用方程 () 创建概率,该方程使用 p 和 _cons 以及 t 表示时间(即马尔可夫循环数)和 u 表示周期长度(通常是一年,因为我与白血病患者一起工作,所以我的时间是 90 天他们很可能发生事件,即复发或死亡)。

所以其中 lambda = p, gamma = (exp(_cons))

gen result = (exp((lambda*((t-u)^ (gamma)))-(lambda*(t^(gamma)))))

gen transitions = 1-result

谈到可变性,我首先计算系数的标准误差

. nlcom (exp(_b[_cons])) (exp(_b[/ln_p]))

       _nl_1:  exp(_b[_cons])
       _nl_2:  exp(_b[/ln_p])

------------------------------------------------------------------------------
          _t |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------
-------------+------
       _nl_1 |   .0116539   .0044932     2.59   0.009     .0028474    .0204604
       _nl_2 |   .6153864    .054186    11.36   0.000     .5091838     .721589

但我真正追求的是转换值的标准错误,例如,

nlcom (_b[transitions])

但这不起作用,而且我正在使用的书并没有给出关于获取这些额外信息的提示。任何关于如何接近的反馈将不胜感激。

4

2 回答 2

1

第二个回答:2014-03-23

更新:2014-03-26我修正了负概率:我在转录 Emily 的代码时出错了。我还展示nlcom了 Austin Nichols 对 Statalist 的建议(http://www.stata.com/statalist/archive/2014-03/msg00002.html)。我对 Austin 的代码进行了一次更正。

自举仍然是解决方案的关键。目标量是通过一个公式计算的概率,该公式基于来自 的估计参数的非线性组合streg由于估计值不包含在e(b)之后返回的矩阵中stregnlcom因此不会估计标准误差。这是自举的理想情况。采用标准方法:创建程序myprog来估计参数;然后bootstrap那个程序。

在该示例中,估计了一系列 t 值的转移概率 pt。用户必须设置范围的最小值和最大值t以及标量u。有趣的是,也许,由于估计参数的数量是可变的,foreach因此需要在内部声明myprog。此外,bootstrap需要一个参数,该参数由myprog. 这个列表也是foreach循环构造的。

/* set u  and minimum and maximum times here */
scalar u = 1
local tmin = 1
local tmax = 3

set linesize 80

capture program drop _all

program define myprog , rclass
syntax anything
streg , nohr  dist(weibull)
scalar lambda = exp(_b[ln_p:_cons])
scalar gamma =exp(_b[_t:_cons])

forvalues t = `1'/`2'{
scalar p`t'= 1 -  ///
(exp((lambda*((`t'-u)^(gamma)))-(lambda*(`t'^(gamma)))))
return scalar p`t' = p`t'
}
end


webuse cancer, clear
stset studytime, fail(died)
set seed 450811

/* set up list of returned probabilities for bootstrap */
forvalues t = `tmin'/`tmax' {
local p`t' = "p" + string(`t')
local rp`t'= "`p`t''" + "=" +  "("+ "r(" + "`p`t''" +"))"
local rlist =  `"`rlist' `rp`t''"'
}

bootstrap `rlist', nodots: myprog `tmin' `tmax'
forvalues t = `tmin'/`tmax' {
qui streg, nohr dist(weibull)
nlcom 1 - ///
(exp((exp(_b[ln_p:_cons])*((`t'-u)^(exp(_b[_t:_cons]))))- ///
(exp(_b[ln_p:_cons])*(`t'^(exp(_b[_t:_cons]))))))
}

结果:

Bootstrap results                               Number of obs      =        48
                                                Replications       =        50
      command:  myprog 1 3
           p1:  r(p1)
           p2:  r(p2)
           p3:  r(p3)

------------------------------------------------------------------------------
             |   Observed   Bootstrap                         Normal-based
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
          p1 |   .7009447   .0503893    13.91   0.000     .6021834    .7997059
          p2 |   .0187127    .007727     2.42   0.015     .0035681    .0338573
          p3 |   .0111243   .0047095     2.36   0.018     .0018939    .0203548
------------------------------------------------------------------------------

/* results of  nlcom */
------------------------------------------------------------------------------
          _t |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       _nl_1 |   .7009447   .0543671    12.89   0.000      .594387    .8075023
-------------+----------------------------------------------------------------
       _nl_1 |   .0187127   .0082077     2.28   0.023     .0026259    .0347995
-------------+----------------------------------------------------------------
       _nl_1 |   .0111243   .0049765     2.24   0.025     .0013706    .0208781
------------------------------------------------------------------------------
于 2014-03-22T20:52:04.890 回答
1

这个答案是不正确的,但我保留它是因为它产生了一些有用的评论

sysuse auto, clear gen u = 90 +rnormal()

设置种子 1234 捕获程序 drop _all

program define myprog , rclass tempvar result reg turn disp /* 这里替换你的 -streg- 语句 */ gen result' = _b[disp]*u sumresult' return scalar sd = r(sd) end

bootstrap sdr = r(sd): myprog estat bootstrap, bc percentile

注意:在引导程序中,新变量(您的结果)必须定义为临时变量;否则 gen 语句将导致错误,因为该变量是为每个引导程序复制重新创建的。

于 2014-03-11T02:23:21.520 回答