问题标签 [log-likelihood]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scikit-learn - AttributeError:由于新版本的 sklearn,'str' 对象没有属性 'parameters'
我正在使用 sklearn 进行主题建模。在尝试从网格搜索输出中获取对数似然时,我收到以下错误:
AttributeError:“str”对象没有属性“参数”
我想我理解的问题是:旧版本中使用了“参数”,而我使用的是 sklearn 的新版本(0.22),这会出错。我还搜索了新版本中使用但找不到的术语。下面是代码:
提前致谢!
r - 从 bife 包计算固定效应 logit 的 AIC
我想问如何计算inf。包中的固定效应 logit 模型的标准,例如 AIC 等
bife
。
基本summmary
输出不包括 AIC,但是在查看时:Goodness-of-fit for fixed effect logit model using 'bife' package
计算了 AIC 标准。我怎么在我的摘要输出和对数似然中都没有它。
r - 如何解释 mle() trace = 6 输出以及为什么 mle() 过程在 R 中的 101 次迭代后停止?
我正在尝试使用 R 中的 L-BFGS-B 方法使用函数 mle() 估计七个约束参数。为了调查为什么会non-finite finite-difference value [2]
出错,我将其包含control = list(trace = 6)
在 mle() 函数中以希望了解有关起源的更多信息的错误。
不幸的是,我不太了解跟踪的输出,这让我感到惊讶:程序似乎只是在 101 次迭代后停止,而没有给我一个适当的理由。
有谁知道为什么?
我想 trace=6 报告的七个 X 值是 mle 过程收敛到此迭代的参数值。在我的对数似然函数中输入这些值给我的值与“最终值”下报告的值相同:-152.449285。当我从第 97 次迭代中估算七个 X 值时,我得到相同的对数似然 -152.449285。
有两件事似乎很突出。首先,X 的第二个值 0.999 正是我估计的第二个参数的上限。其次,与其他 G 值相比,G 的第二个值在 -412.172 处似乎相对较大。G到底是什么意思?X 和 G 的第二个值在很多次迭代中都是这样的。这是否给了我一个线索,我怎样才能使估计工作?提前致谢!
由于我的问题是关于结果的解释/直觉,我没有提供可重复的例子。它有很多代码,我不知道如何用一点点代码来重现这种情况。如果您需要我的代码,请告诉我。
最后的第 101 次迭代:
---- 更新 1 ---
我听从了 Roland 的建议,但首先尝试将 maxit 设置为 200: control = list(maxit=200, trace=6)
。
该过程现在在第 106 次迭代时收敛,但是,我仍然收到之前的错误:
---- 更新 2 ---
我遵循了 Biswajit Banerjee optim in r : nonfinitefinite Difference error 的建议,并将 ndeps 设置?optim
为“梯度的有限差分逼近的步长向量”,第二个参数为 0.0001(所有参数默认为 0.001其他参数)。现在一切正常!请问这是否与第二个参数的值是上限或G值比较大有关?
r - 您如何使用高维数据计算 R 中的 BIC
我有一个包含 200 个参数和 50 个观察值的高维数据集。我正在尝试计算 R 中的 BIC。我知道 BIC=log(n)*df-2*log(L) 其中 L 是可能性。我只是想知道如何计算 L。我相信我需要计算 MSE,但我不知道该怎么做。
r - 使用 R 计算从两个正态分布的混合中采样的一组观测值的对数似然
我编写了一个函数来计算从两个正态分布的混合中采样的一组观察值的对数似然。这个功能没有给我正确的答案。
我不知道任何给定样本来自两个分布中的哪一个,因此该函数需要对可能性求和。
该函数将五个模型参数的向量作为其第一个参数(μ1、σ1、μ2、σ2 和 p),其中 μi 和 σi 是第 i 个分布的均值和标准差,p 是样本的概率来自第一个分布。对于第二个参数,该函数采用观察向量。
我写了以下函数:
我可以创建测试数据,我知道解决方案应该是〜-854.6359:
当我在测试数据上测试此功能时,我没有得到正确的解决方案
我知道解决方案应该是~-854.6359。我的功能哪里出错了?
r - 是否有用于评估 ARIMA 模型给定数据和参数集的 pdf 的 R 函数?
我不熟悉 R,但我已经能够编写代码来估计 ARIMA 模型的参数,无论我在文件中的某些数据的顺序是什么。它看起来像这样:
但是,我有兴趣评估一组特定参数值的似然函数,而不仅仅是找到最大化给定数据集似然性的参数。在给定 ARIMA 参数值的情况下,是否有一个函数可以让您仅评估数据的概率密度?
提前致谢!
matlab - fitnlm 后 MATLAB R2017B LogLikelihood 中的小错误?
背景:我正在研究一个类似于链接 [1] 中描述的非线性逻辑回归的问题(我的问题更复杂,但链接 [1] 对于本文的下一部分来说已经足够了)。将我的结果与与 R 包并行获得的结果进行比较,我得到了相似的系数结果,但(非常近似)相反的 logLikelihood。
假设: matlab中fitnlm给出的logLikelihood实际上是负LogLikelihood。(请注意,这会损害 Matlab 的 BIC 和 AIC 计算)
推理:在[1]中,同一个问题通过两种不同的方法解决。ML-approach/ 通过定义负对数似然并使用 fminsearch 进行优化。GLS 方法/通过使用 fitnlm。
ML 方法后的负对数似然为:380
GLS 方法后的负对数似然为:-406
我想第二个应该至少乘以(-1)?
问题:我错过了什么吗?(-1) 系数是否足够,或者这种简单的修正还不够?
自包含代码:
资源:
[1] https://uk.mathworks.com/help/stats/examples/nonlinear-logistic-regression.html
r - 我如何估计最大似然目的地的标准误差
我无法估计最大似然估计中参数的标准误差。我该怎么办?
python - 最大似然估计 Python
假设我的数据点像递减指数函数一样随时间分布,但它包含方差为 20 的零均值高斯噪声。我将如何确定似然函数并找到参数的 MLE?所以我只有以下数据:我已经使用 python 拟合了一条指数曲线。我的尝试:
所以我不确定如何确定仅给定数据集的似然函数。我是否需要假设数据的分布情况?(平均噪声为 0)。
r - 使用方法 maxLogL 时如何在变量中保留 BIC、AIC 和 maxloglikelihood
我正在使用最大化可能性的方法拟合一些分布。R“maxLogL”中实现的方法是一个很棒的工具,效果很好。文档:
- https://cran.r-project.org/web/packages/EstimationTools/vignettes/maxlogL.pdf
- https://www.rdocumentation.org/packages/EstimationTools/versions/1.2.1/topics/maxlogL
AIC 和 BIC 使用汇总函数打印,但我想将这些值保留在变量中。这是您可以轻松重现的代码:
打印以下内容:
我的问题是:
- 如何将 AIC 和 BIC 保存在变量中?
- 对数似然的最大值是否保存在某处?我可以使用 BIC 和 AIC 的逆向工程来获得它,但我想避免这种情况。
谢谢
PD:我特别想使用 maxLogL 函数。