问题标签 [log-likelihood]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
35 浏览

r - 将似然方程转换为 R 代码

我正在用 R 编写 GP 模型并计算其似然函数。

我在将下面的等式转换为 R 代码时遇到问题:在此处输入图像描述

我使用了下面的代码,但我不断收到错误消息:

我的代码是:

我认为这与2个和符号有关。我找不到一个示例来说明如何处理 2 个和号并遵循它们的结构。

我尝试逐部分调试它以检查我出错的地方,每次我到达这部分时,我都会收到错误消息:

任何建议将不胜感激。

0 投票
2 回答
5383 浏览

python - 在python中实现负对数似然函数

我在 python 中实现负对数似然函数时遇到了一些困难

我的负对数似然函数给出为:

负对数似然方程的屏幕截图

这是我的实现,但我不断收到错误:ValueError: shapes (31,1) and (2458,1) not aligned: 1 (dim 1) != 2458 (dim 0)

X 是大小的数据框:(2458, 31), y 是大小的数据框:(2458, 1)theta 是大小的数据框:(31,1)

我无法弄清楚我错过了什么。我的实现不正确吗?任何帮助将非常感激。谢谢

0 投票
1 回答
592 浏览

python - 将附加参数传递给 numdifftools Hessian

我想获得以下函数的Hessian:

我正在尝试使用 numdifftools 包的 Hessian 函数来做到这一点。在文档中,我找到了以下信息。例如,如果您想要定义为 Rosen 的 Rosenbrock 函数的 hessian,则 hessian 的计算方式如下:

在点 [1,1] 计算 Hessian 的地方

按照文档,应该可以为 Hessian 函数提供参数:

我通过以下方式进行了尝试:

themin.x 是我要评估 Hessian 的点。

运行上述代码时出现的错误:

我不明白元组如何超出范围

0 投票
0 回答
23 浏览

r - 具有协变量的一阶删失自回归过程的可能性(参见 Jung Wook Park1、Marc G. Genton2 和 Sujit K. Ghosh3)

我运行此代码(它用于带有协变量的审查一阶自回归过程,我有 4 个 x(t) 的案例,x(t-1) 要么是审查的,要么是未审查的,我不希望可能性接近零并且inf).我得到错误

if (any(likelihood == Inf)) { : 需要 TRUE/FALSE 的缺失值调用自:fn(par, ...)

该程序适用于 n=100 但当 n 大于 100 时出现此错误。我认为这个错误会导致对四个参数(b1、rho、sigma、b0)的错误估计。有人知道我能做什么吗?

谢谢您的帮助。

0 投票
0 回答
23 浏览

r - R:t分布的MLE估计差异

我目前正在开展一个小组项目,估计一系列回报的 VaR 和 ES。其中一项任务是估计分布的自由度。

我正在使用以下方法:

例如,这会产生:

[1] 2.986434

但是,根据作业中给出的经验数据,我使用例如包 MASS 得到了 DF 的不同值:

此外,我的其他小组成员在使用实际数据集时也获得了不同的结果。

我上面的功能有缺陷吗?这里可能是什么问题?

0 投票
0 回答
222 浏览

machine-learning - 给定使用 Keras 构建的回归器,使用负对数似然损失,我怎样才能将均值和标准差作为单独的输出?

使用自定义损失函数,我很难让回归器正常工作。我目前正在使用几个数据集,其中包含用于跨精度计算基准实验的数据,这是其中一个的片段:

(提前为降价表抱歉,找不到更好的方法来做到这一点)

每个 err_ds_* 列都是使用指定的 var_* 配置从不同的基准执行获得的(每个 var 包含用于特定变量的精度位数);每个错误单元格实际上包含错误的负自然对数(因为实际值非常小),并且每行的 err_mean 和 err_std 都是根据这些值计算的。

在网络数据准备期间,我重塑了数据集,以便将每个基准测试作为单独的行执行(这意味着我们将有多个行具有相同的 var_* 值,但错误值不同);然后我将数据(我们通常给 fit 函数的东西作为 x)和目标(我们通常给 fit 函数的东西作为 y)分开,因此分别获得:

最后,我们再次拆分集合以获得训练数据(我们将调用train_data_regrand train_target_tensor)和测试数据(我们将调用test_data_regrand test_target_tensor),所有这些都使用scaler_regr_*.fit_transform(df)(其中 scaler_regr.* 是 StandardScaler( ) 来自 sklearn.preprocessing),并输入网络:

最后,通过自定义函数评估获得的数据,该函数将实际数据与预测数据(即真实均值与预测均值和真实标准与预测标准)与多个指标(如 MAE 和 MSE)进行比较,并使用 matplotlib 绘制结果。

这个想法是,给定 var_* 配置作为输入,网络的两个输出将预测错误的均值和标准差。

现在,让我们提出一个问题:因为使用这段代码,我在预测平均值时得到了非常好的结果(即使使用不同的基准测试),但在预测标准差时结果很糟糕,我想问这是否正确预测这两个值的方法。我敢肯定我在这里遗漏了一些非常基本的东西,但两周后我认为我被卡住了。

0 投票
1 回答
42 浏览

wolfram-mathematica - 数学中的对数似然和多项分布

有人可以向我解释为什么下面的代码

对数似然[MultinomialDistribution[countstot, {dt1/ttot, dt2/ttot, dt3/ttot, dt4/ttot, dt5/ttot}], {CR1, CR2, CR3, CR4, CR5}]

不会产生一个数字作为输出,而是这样:

对数似然[MultinomialDistribution[156, {318/1049, 159/1049, 208/1049, 222/1049, 142/1049}], {0.00186, 0.00185, 0.00136, 0.00108, 0.00115}]

这是我第一次使用 LogLikelihood 和 MultinomialDistribution,我可能做错了什么,但我真的不明白是什么。

谢谢

0 投票
1 回答
234 浏览

python - 似然比检验和伪 Rsquared 差异显着(逻辑回归)

我申请了一个logistic regression并且我想测试我的整体模型的统计显着性。

现在,伪 Rsquared (McFaddon)Rsquared = 1 - L(c)/L(null)返回模型解释的方差 - 其中L(c)表示拟合模型的最大似然值,并L(null)表示空模型的对应值(无协变量,只有截距)。

似然检验统计LR = 2 * (L(c) - L(null))遵循分布,可以根据Chi-squared模型的自由度检验显着性。

无论如何,我使用Chi-squared来计算p-value非常重要的a ,但是在???pseudo Rsquared0.021

为什么 Rsquared 和整体 p 值差异如此之大?

对一些测试数据使用准确度计算metrics.accuracy_score(y_test, y_pred),我发现测试数据的准确度只有 55% 左右(训练数据的准确度在 60% 左右)。

有人可以帮我解释我的结果吗?

0 投票
1 回答
53 浏览

r - 如何增加 R MASS::profile 返回的值的数量?

简短的问题是:profile() 返回 12 个参数值。如何使它返回更大的数字?

我提出问题的动机是重现David W. Hosmer Jr.、Stanley Lemeshow 和 Rodney X. Sturdivant (2009)的Applied Logistic Regression 3rd Edition中的图 1.3 ,它绘制了x = age over 的系数对数可能性的轮廓confint() 间隔。

图 1.3 HLS

glm 模型是

它将 100 名患者的是否患有冠心病与年龄联系起来。该模型的结果与第 1 页正文中的表 1.3 一致。10.

为方便起见,数据的 csv 文件在我的要点中

使用Ben Bolker提供的指导,将 MASS::profile 的偏差输出乘以 -0.5,以使用jebyrnes在稍后对同一帖子的评论中提供的 tidy 函数在2011 年的帖子中转换为负对数似然。

可以绘制此图以获得 HLS 图 1.3 的近似值,其中 alpha = 0.95 区间的 ablines 从

图例中的不对称性可以用

情节是用

需要调整的地块

需要进行两项调整:

  1. 曲线应通过分别沿 x 和 y 轴添加 beta 值和对数似然值来平滑。

  2. beta 的范围应设置为大约 [0.0575,0.1625](视觉上,从图中)。我认为这可以根据需要通过子集来完成。

关于图中 logLik y 截距的注释。它似乎是基于对数似然的转置值。请参阅第 1-3 页的表 1-3。10,其中它给出为 -53.676546,与 p 上的等式相比。19 转置为 -53.6756。

0 投票
1 回答
141 浏览

python - 可扣除的建模——难以用 scipy.optimize.minimize 实现收敛

我是 Python 新手。如果我的代码感觉不舒服,我提前道歉。在过去的几周里,我一直在研究一项称为可扣除建模的困难统计挑战。我会尽量避免不必要的统计术语并保持问题简单,因为据我了解,我的问题是编程/优化问题,而不是统计问题。

如果您认为应该,请将此主题移至更合适的堆栈交换站点

我有 8 个参数,其中 2 个是受约束的,应该是正数(phi_freqphi_sev)。我正在尝试最大化对数似然函数,该函数基本上是所有这些参数的非凸、多模态、连续、实值、不可微 (AFAIK) 函数。哎呀!

我知道这些问题意味着提供给搜索算法的种子值将对我们收敛到的局部/全局最优值产生巨大影响,但据我所知,我的起始值是可靠的,即使是硬编码的(在提供的示例中下面),是辅助优化的结果,而不仅仅是主观预感。

我曾尝试使用库的Nelder-MeadandSLSQP方法(SLSQP已注释掉)scipy.optimize.minimize,但返回的值很尴尬且毫无意义。

以下是 MWE:

我不确定目前如何以及是否需要提供数据(示例代码中引用的policiesclaims平面文件)。我准备这样做,但需要先将它们匿名化。

所以,我想此时任何指针都会受到欢迎,因为我快要碰壁了。有一个全局解决方案,必须有,这意味着mle(最大似然估计)必须存在。我的种子值非常现实,因为它们是通过矩匹配(所谓的method of moments估计器)获得的。我觉得一定有什么我做错了。此外,尽管听起来很蹩脚,但我什至使用 's 求解器重现了完全相同的问题Excel,并遇到了类似的数值收敛问题。我很乐意提供有关此问题的补充细节,无论技术与否。