问题标签 [logistic-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 MuMIn 使用 QAIC 对模型进行排名
我需要使用 QAIC 标准对候选模型进行排名。这是我尝试过的:
这将返回此错误:
如何使用 QAIC 对上述模型进行排名?
matlab - matlab中使用L1正则化的高效逻辑回归
我正在 matlab 中寻找一个有效的逻辑回归实现。我在matlab中使用了lassoglm。但是当我尝试使用 10000 个具有 1000 个特征和正则化参数为 0.005 到 1 的示例时,它真的很慢。我使用两次交叉验证。从 lambda 0.05 开始,它非常慢并且需要很多时间。
有没有更好的方法?
python - 图像分类软件
目前我正在为一个项目工作,将一组给定的测试图像分类为 5 个预定义类别之一。我使用每个图像的 240 个特征的特征向量实现了逻辑回归,并使用 100 个图像/类别对其进行了训练。每个类别的学习准确度约为 98%,而在包含 500 张图像(100 张图像/类别)的验证集上进行测试时,只有约 57% 的图像被正确分类。
请向我推荐一些我可以使用的库/工具(最好基于神经网络)以获得更高的准确性。
我尝试在 Windows 上使用基于 Java 的工具 Neurophy ( neuroph.sourceforge.net ),但它没有按预期运行。
编辑:已经为项目提供了特征向量。我也在寻找更好的图像特征提取工具。
sas - 稀疏数据的逻辑回归
我正在使用逻辑回归模型进行一些预测分析。我们有大约 25 个预测变量和 1 个二元结果 (Y/N) 变量。我正在模拟结果为“Y”的概率。
我的训练数据集中有 400,000 条记录,而评分集中有相同的数字。训练集中出现“Y”的概率为 0.1%。SAS 输出的模型的 C 统计量为 0.97,非常好。
当我在我的评分集上运行模型时,我的“阳性预测值”,即正确识别的“Y”与总“Y”的比率,小于 1,这使得我的模型毫无用处。有人可以建议我如何提高阳性预测值吗?
r - 创建一个将在所有自变量上运行逻辑回归的循环
我想使用所有可用变量运行逻辑回归的因变量(在我的数据集中它是:dat$admit),每个回归都有自己的自变量与因变量。我想要得到的结果是每个回归摘要的列表。使用下面提交的数据集应该有 3 个回归。
这是一个样本数据集(其中承认是逻辑回归因变量):
我得到了一个简单线性回归的示例,但是当我尝试将函数从 lm 更改为 glm 时,结果得到了“list()”。
这是原始代码 - 鸢尾花数据集,其中“Sepal.Length”是因变量:
如何为逻辑回归创建正确的函数?
r - 在两部分(障碍)回归模型中编码分段回归项
我正在使用两部分或障碍模型来模拟给定一组协变量(障碍部分)和另一组协变量来模拟模型的负二项式部分的飞行概率。
首先,我反复搜索最佳预测变量来解释数据中是否存在零。根据 AIC 标准选择了一个连续预测变量和一个二分预测变量。然后我探索了连续预测变量的分段项的使用。连续协变量中的一个断点显着改善了拟合。
这是分段包的输出
U1.approach_km 系数的斜率是其系数与 approach_km 系数之间的差,基本上为零。因此,在大于断点的距离处,方法_km 不再预测存在或不存在。
我想出了一种在这些变量中编码的方法,以便将它们添加到障碍模型中,这只是一个基本的 glm 形式,但有两组(可能不同的)coavriates,由 | 分隔。象征。
这导致相同的系数估计值但不同的 Std。错误。它还导致相同的残余偏差(均为 508.36)和相同的 AIC 分数 516.36,尽管自由度不同(分割对象少一个)。
关于如何获得 Std 的任何想法。将这个公式输入障碍包时,错误是否一致或无关紧要
r - 在 R 中使用多项式函数进行多项式回归
我正在考虑在 Cross-Validated 中发布我的问题,但决定来这里。我正在使用 nnet 包中的 multinom() 函数来估计受年龄和教育程度影响的就业、失业或失业的几率。我需要一些翻译方面的帮助。
我有以下数据集,其中包含一个因分类变量就业状况(EmpSt)和两个独立分类变量:年龄(Age)和教育水平(教育)。
以下是级别的摘要:
- 一、什么是估计方程(模型)
我想确定调用的估计方程(模型)是什么
df$EmpSt<-relevel(df$EmpSt,ref="Employed")
multinom(EmpSt ~ Age + Education,data=df)
所以我可以把它写在我的研究论文中。据我了解, Employed 是基本级别,此调用的 logit 模型是:
其中 i 和 n 分别是变量年龄和教育的类别(对不起,符号混乱)。如果我对 multinom() 产生的逻辑模型的理解不正确,请纠正我。我不打算包含测试的摘要,因为它有很多输出,所以下面我只包含 call 的输出>test
:
鉴于我对 multinom() 生成的 logit 模型的理解是正确的,因此系数是使用基本级别的记录几率。为了得到实际的赔率,我通过电话来反对,exp(coef(test))
这给了我实际的赔率:
这让我想到了下一个问题。
- 二、概率
我想知道是否有一种方法可以根据年龄和教育程度来获得失业与就业的实际概率,例如,如果我 22 岁并且拥有高中文凭,那么失业的概率是多少。很抱歉这个冗长的问题。谢谢你的帮助。让我知道是否需要进一步澄清。
r - R中多项logit回归的奇怪错误
我尝试在 R 中进行多项 logit 回归。我使用了以下命令:
适合 <- glmnet(xdata, newdata2$state, family="multinomial" )
但我收到了这个错误:
错误:来自 glmnet Fortran 代码(错误代码 8001);第 1 类 < 1.0e-5 的空概率
我不知道我应该如何解决这个错误,我会感谢任何帮助。另外请让我知道是否有任何更简单的方法可以在 R 中执行多项 logit 回归(而不是仿生回归)。
编辑:
r - 没有从 R 中的 zeroinfl 对象预测的零?
我创建了一个零膨胀负二项式模型,并想调查有多少零被划分为采样或结构零。我如何在 R 中实现这一点。我不清楚 zeroinfl 页面上的示例代码。
这是在告诉我什么?
当我对我的数据执行相同操作时,我得到的读数只是在 1? 谢谢
sas - 如何在 SAS 中对数据集中的所有变量运行 PROC LOGISTIC?
我有一个包含 300 多个变量的数据集,我想在 PROC LOGISTIC 中对所有这些变量执行逐步选择(我知道逐步选择在这里是一个坏主意,但这不取决于我) - 其中一些是数字,其中一些是分类的。
如果不键入 300 多个变量中的每一个的名称,我如何编写模型语句,以便模型是我的数据集中的所有变量,除了我的响应变量?我如何编写类语句,以便它知道将所有分类变量视为分类变量?