问题标签 [lasso-regression]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

378 问题

0 投票

1 回答

1827 浏览

r - 套索，glmnet，数据预处理

我试图使用 glmnet 包在具有二进制结果（logit）的模型上拟合套索（L1 惩罚）。我的预测变量都是二进制的（它们是 1/0 未排序的，~4000），除了一个连续变量。我需要将预测变量转换为稀疏矩阵，因为它需要永远和一天。我的问题是：似乎人们正在使用 sparse.model.matrix 而不仅仅是将他们的矩阵转换为稀疏矩阵。这是为什么？我需要在这里做吗？两种方法的结果略有不同。

另外，我的因子是否需要编码为因子（当涉及到结果和预测变量时）或者使用稀疏矩阵并在 glmnet 模型中指定结果是二项式就足够了？

这是我到目前为止所做的

所以总结我的两个问题是：1-即使我的因子只是二进制而不是有序的，我是否需要使用 sparse.model.matrix？[如果是的话，它实际上与仅将矩阵转换为稀疏矩阵有什么不同] 2-我需要将二进制变量编码为因子吗？我问的原因是我的数据集很大。无需编码即可节省大量时间。

2014-05-21T16:01:47.310

0 投票

1 回答

272 浏览

matlab - 恒定曲线拟合中 Lasso 的零输出

我想用非线性函数的总和来近似一个常数函数。我可以用普通的最小二乘来做到这一点，但是用套索会出错，可能是因为要逼近的函数是常数。我在下面的 Matlab 中给出了一个玩具示例：

我注意到套索首先从输入和输出中减去平均值，所以这将给出零输出，因此所有零权重都是由套索产生的。有什么办法可以规避这种情况吗？或者另一种方法来获得权重的稀疏结果？

matlab sparse-matrix lasso-regression

2014-06-04T09:29:52.670

0 投票

2 回答

9506 浏览

python - Lasso sklearn 中的选项 normalize = True 有什么作用？

我有一个矩阵，其中每列的平均值为 0，标准值为 1

如果我使用 normalize 选项，非 0 系数的数量会发生变化

在我看来，规范化只是将每列的方差设置为 1。结果变化如此之大，这很奇怪。我的数据已经方差= 1。

那么 normalize=T 实际上是做什么的呢？

python machine-learning scikit-learn lasso-regression

2014-06-07T14:28:48.957

0 投票

0 回答

806 浏览

lambda - stata中的LASSO reg（plogit函数）

我是 LASSO 方法的新手（我知道它主要是在 R 中完成的，但我不知道 R）。所以在 stata 中有一个用户编写的代码 plogit 可以做套索（byTony Brady 和 Gareth Ambler）。有人用过吗？

如果是这样，我的问题是 lambda (#) 的最佳值是多少？我有 20 个解释变量。我将 lambda 值设为 14，得到 11 的系数。= 0.000，而 lambda = 6，我得到 4 个变量 = 0.00

那么最佳值是多少呢？在帮助 plogit 中，它说“更高的 lambda 值会带来更多的惩罚）

非常感谢！

lambda lasso-regression

2014-07-09T19:53:25.810

0 投票

5 回答

6058 浏览

r - How does glmnet compute the maximal lambda value?

The glmnet package uses a range of LASSO tuning parameters lambda scaled from the maximal lambda_max under which no predictors are selected. I want to find out how glmnet computes this lambda_max value. For example, in a trivial dataset:

The package vignette (http://www.jstatsoft.org/v33/i01/paper) describes in section 2.5 that it computes this value as follows:

Which clearly is close but not the same value. So, what causes this difference? And in a related question, how could I compute lambda_max for a logistic regression?

r glmnet lasso-regression

2014-08-12T06:43:44.007

0 投票

1 回答

4789 浏览