问题标签 [logistic-regression]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
3955 浏览

machine-learning - 此数据集的逻辑回归和朴素贝叶斯

朴素贝叶斯和逻辑回归都可以完美地分类这两个数据集吗?我的理解是朴素贝叶斯可以,复杂项的逻辑回归可以对这些数据集进行分类。如果我错了,请帮忙。

数据集的图像在这里:

在此处输入图像描述

0 投票
2 回答
1431 浏览

machine-learning - sigmoid 函数在逻辑回归中真的很重要吗?

我实现了一个二元逻辑回归分类器。只是为了玩,我用 tanh 替换了 sigmoid 函数 (1 / 1 + exp(-z))。结果完全相同,分类阈值为相同的 0.5,即使 tanh 在 {-1,1} 范围内,而 sigmoid 在 {0,1} 范围内。

我们使用 sigmoid 函数真的很重要吗,或者像 tanh 这样的任何可微的非线性函数都可以工作吗?

谢谢。

0 投票
1 回答
880 浏览

r - 使用 R 回归消费者购买行为

我正在追求一个项目作为我 MBA 的一部分,虽然我有一些基本的统计背景,但我对深度回归分析非常陌生。我正在寻找使用 R 进行分析以学习新工具。我对 R 很陌生,所以你愿意提供的细节越多越好。

这是我正在使用的数据的描述。如果我应该以某种方式对其进行转换,我确实有更精细的数据。数据描述了消费者购买(或不购买)产品的选择——所以我的二元结果是购买/不购买。他们购买产品(例如产品 X),但在此过程中查看产品 A、B、C 和 X。我想根据产品 A、B 和 C 对卖出 X 的可能性。

变得困难的是在购买之前查看了可变数量的产品,实际上是 1 --> n 个产品。每个时间点也可能是一个因素。如果消费者今天评论产品并在今天购买,这可能与购买前 2 周评论产品不同。我也有每个产品的准确时间信息。

我的问题是:如何构建回归模型来考虑同一消费者的动态数量的自变量?

如果我不够具体,请告诉我。

谢谢!

0 投票
1 回答
2642 浏览

r - 如何在 nnet 包中的 multinom() 中设置特定的对比?

我有一个需要分类的三类问题。我想在nnet包中使用多项逻辑回归。班级结果有 3 个因素,P、Q、R。我想将 Q 作为基本因素。

所以我试着把它写成这样的对比:

检查了它:

现在multinom()

输出:

问题:
如您所见,由于 P 类没有出现在输出中,这意味着在处理 R 中的因子变量时,它被视为按字母顺序排列的第一个基类,而 Q 类没有被视为在这种情况下,基础级别,如何使其以其他两个级别为基础?

0 投票
1 回答
1607 浏览

machine-learning - Bootstrap aggregation (bagging) of logistic regression classifiers

So I'm taking N bootstrap samples and training N logistic regression classifiers on these samples. Each classifier gives me some probability of being in a binary class and then I average these N probabilities to get a final prediction.

My question is if I took the N sets of regression coefficients and averaged those and used that averaged set of coefficients in a logistic regression classifier and took the output probability as the final prediction, is this the same as taking the average of the resultant N probabilities as described in the previous paragraph?

0 投票
0 回答
247 浏览

scikit-learn - 交叉验证后是否可以在新的测试集上使用 estimator.predict?

我有一个关于 scikit 的新问题要问你。

分类问题,逻辑回归作为估计。我有我的 X 数据集和我的特征。

我想通过交叉验证使用我的算法,我有两种方法:我手动将我的数据集拆分为 5 个子集,最后我迭代 5 次,每次留下不同的集合进行测试。我获得了我的分数,但我现在想要的是与估计器一起使用以在新数据集上进行预测的系数的平均值。我在stackoverflow上的某处读到可以将系数传递给scikit逻辑回归估计器。

另一种方法是使用cross_val_score

在交叉验证估计后给我交叉熵。但是,如果现在我想使用平均系数并使用估计器对我的新的未标记数据集进行新的预测怎么办?

谢谢!

0 投票
1 回答
3536 浏览

r - r中的装袋逻辑回归

R_blogger 提供了以下代码,其中我的添加被注释掉了,因为它们不起作用;我正在寻找一种从迭代逻辑回归中保存系数向量和 p 值的方法,这样我就可以修剪那些一直得分不佳的变量。

我希望能够检索类似于预测的系数和 p 值的对象

0 投票
1 回答
8138 浏览

matlab - Matlab中的逻辑回归梯度下降

这是代码

我遇到的问题是对数似然比首先降低,然后开始增加。这是梯度下降算法或代码的问题。

0 投票
2 回答
4465 浏览

python - 如何在使用 python scipy.optimize.minimize 时确保解决方案是全局最小值

我在python中实现逻辑回归。为了找到 theta ,我一直在努力决定哪个是始终保证全局最优而无需担心初始参数 theta 的最佳算法。

其中 ex2data1.txt 的内容是:

上面的代码给出了 theta = Result.x 值为 [-25.87282405 0.21193078 0.20722013]。如果 initial_theta = np.zeros((n,1)),这是全局最小值。但如果 initial_theta = np.ones((n,1)),则会出错。所以在这种情况下,我们的结果取决于参数 theta 的初始值。那么这可以以任何方式自动化以避免这个问题。

我还尝试在最小化函数调用中使用'BFGS'方法而不是'TNC'方法,如下所示,然后我得到了RuntimeWarning。

我已经用不同的 initial_theta 初始值多次调用上述函数,我发现 BFGS 最大时间收敛到局部最小值。当我用

更接近全局最小值,它收敛了。所以看起来 TNC 比 BFGS 好,因为在两种情况下 intial_theta 相同,TNC 收敛到全局最小值,而 BFGS 收敛到局部最小值。所以

  1. 在所有情况下都是如此还是取决于特定问题?
  2. BFGS 和 TNC 哪个更好?
  3. scipy.optimize.fmin_bfgs 和 scipy.optimize.minimize 与方法参数 = 'BFGS' 或两者是否相同?

任何帮助或见解都会有所帮助。谢谢你。

0 投票
0 回答
6804 浏览

r - predict() 错误:替换的行多于数据

我真的无法弄清楚为什么我在使用predict(). 我检查了这篇文章,但我仍然收到相同的错误predict()。我将一个数据框分成两部分(1. 训练,2. 测试)。

我在火车上运行了一个逻辑模型并将其应用于测试,但出现错误。这是代码:

我不断收到此错误。我再次将 predict 语句作为独立向量运行,它返回了一个长度为 train 数据帧的向量。

关于发生了什么的任何想法?我的代码错了吗?

解决方案

predict()需要newdata=而不是data=,doh!