问题标签 [logistic-regression]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5143 浏览

r - 如何在几年前拟合的逻辑回归中使用 R 中的预测函数?

我有一个问题,我试图解决但没有成功。搜索了两天多,我没有得到任何线索。对不起,如果答案在那里,我没有找到它。

假设您有一个来自几年前估计的旧模型的逻辑方程回归(二元模型)。因此您知道参数 βk (k = 1, 2, ..., p),因为它们是过去估计的。但是您没有用于拟合模型的数据。

我的问题是:我可以在 R 中引入这个旧的估计逻辑模型作为对象(对应于逻辑回归模型)吗?

我想使用“预测”功能用一组新数据(当前数据)证明这个逻辑回归,然后检查这个旧模型经得起时间考验的有效性。要使用此功能,您需要逻辑回归模型的对象。

非常感谢您提前。

0 投票
1 回答
138 浏览

classification - 具有二进制输出和分类的逻辑回归之间的区别

大家好,大数据/统计专家,

我现在在上大数据课,想知道目前在实践中使用这些技术的人是否可以向我解释逻辑回归和分类在特征控制和输出方面的实际差异。

谢谢

0 投票
1 回答
3683 浏览

r - 使用 glm.fit、bigglm、speedglm、glmnet、LiblineaR 对逻辑回归进行基准测试

我正在模拟数据并比较二元 logit 模型的 glm.fit、bigglm、speedglm、glmnet、LiblineaR。

示例运行如下所示:

我经常看到来自 LiblineaR 的估计值很接近,但迹象却相反!有人知道为什么会这样吗?它通常是最快的,并且在我见过的更大数据集的情况下甚至更快。

我知道由于正则化,这些值不会相同;我对这些迹象更好奇。

如果有人(rep>1500)可以请添加#LiblineaR 和#speedglm 标签,我将不胜感激。

0 投票
1 回答
1151 浏览

python - python将字符串输入矩阵转换为0-1二进制输入矩阵,用于逻辑回归,如R

我正在使用 pandas+numpy+scikit-learn 使用 Python 进行一些逻辑回归。然而,在 scikit-learn 内置逻辑回归模型中,它不允许字符串输入,但我想在 R 中做类似的事情,将 str 列输入直接转换为具有 0-1 二进制输入的几个稀疏列。

例如在 R 中,如果我这样做:

不会有问题,但是在python中,它会抛出错误,因为它不能接受str输入。

有没有现有的方法可以做到这一点?因为我不了解 Cython,而且我不想在 python 级别重新编写它......

我希望我在这里足够清楚。有什么帮助吗?

非常感谢

0 投票
1 回答
48 浏览

stata - 运行 logit 回归时显示每个变量类别的 N

当我运行以下回归时,我想要变量下每个类别的 N:

logit RIC i.BMF2 Kerosene Male ib1.agegroup3 ib5.Education2 ib3.Occupation2 i.Household_monthly Smoker, or

这样我就可以知道每个类别中是否只有几个人,或者很多人。我知道我可以tab RIC variable, by(Sex)为每个变量做一些类似的事情,但这并不能确保这是回归使用的实际人数(因为它只考虑对所有变量都有响应的人回归,对吗?)

0 投票
4 回答
27916 浏览

matlab - matlab中的正则化逻辑回归代码

我正在尝试正则化 LR,在 matlab 中使用以下公式很简单:

成本函数:

梯度:

这不是matlab代码,只是公式。

到目前为止,我已经这样做了:

成本函数给出了正确的结果,但我不知道为什么梯度(一步)不是,成本给出的 J = 0.6931 是正确的,梯度 grad = 0.3603 -0.1476 0.0320,不是,成本开始从 2 开始,因为参数 theta(1) 不必正则化,有什么帮助吗?我猜代码有问题,但 4 天后我看不到它。谢谢

0 投票
1 回答
362 浏览

r - R中广告分析的逻辑回归

我有一个数据集,我试图测试 7 天的广告期是否比 5 天的广告期更好。我觉得逻辑回归将是测试这一点的最佳方法。我每次进行 2 周的测试。我有流量、注册、损耗等数据。

以下是数据的样子:

1 表示是,0 表示否。

我在 R 中运行了这段代码:

然后

我的输出是:

或者

我怎样才能运行它,以便我只得到 1 个输出来告诉我 1 或 0(IE 7 天的总体增长是否超过 5%?)

谢谢

0 投票
2 回答
8332 浏览

r - R如何获得多项logit的置信区间?

让我以多项 logit 上的 UCLA 示例作为运行示例 ---

我想知道我怎样才能得到 95% 的置信区间?

0 投票
2 回答
1102 浏览

r - 混合效应逻辑回归中每个集群/组的可变样本量

我正在尝试运行混合效应逻辑回归模型,但我担心每个集群/组中的可变样本大小,以及某些模型中的“成功”数量非常少。

我有大约 700 棵树分布在 163 个田地(即集群/组)中,从 2004-11 年开始每年访问。我为研究的每一年拟合单独的混合效应逻辑回归模型(以下称为 GLMM),以将此输出与来自共享脆弱模型的推论(即随机效应的生存分析)进行比较。

每块地块的树木数量从 1 到 22 不等。此外,有些年份的“成功”数量非常少(即病树)。例如,2011 年在 694 个“失败”(即健康的树木)中只有 4 个成功。

我的问题是:(1)当推理的重点仅在于估计 GLMM 中的固定效应时,理想样本数是否有一般规则,(2)当存在如此极端的差异时,GLMM 是否稳定?成功率:失败率。

感谢您对来源的任何意见或建议。

-莎拉

0 投票
2 回答
725 浏览

clojure - 使用 Incanter 在 Clojure 中使用 BFGS 最小化算法进行逻辑回归

我正在尝试使用Incanter 数据分析库在 Clojure 中实现一个简单的逻辑回归示例。我已经成功编写了 Sigmoid 和 Cost 函数,但是 Incanter 的 BFGS 最小化函数似乎给我带来了一些麻烦。

当我尝试(minimize (cost-func X y) (matrix [0 0]))给出minimize一个函数并启动参数时,REPL 会抛出一个错误。

我对最小化函数的期望是什么感到非常困惑。

作为参考,我用 python 重写了它,所有代码都按预期运行,使用相同的最小化算法。

输出

我不明白为什么 Python 代码可以成功运行,但我的 Clojure 实现却失败了。有什么建议么?

更新

重新阅读文档字符串,因为minimize我一直在尝试计算其导数cost-func会引发新错误。

使用trans将 1xn col 矩阵转换为 nx1 行矩阵只会产生相同的错误和相反的错误。

:asize [1 2], :bsize [2 1]}

我很迷失在这里。