问题标签 [glmnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1164 浏览

r - 为什么 predict.glmnet 会忽略传递给它的 lambda 值,是否有解决方法让它接受该值?

在下面的代码中,我希望两个打印语句打印相同的结果,因为我明确地将参数传递s给两个预测函数。

但是,结果非常不同,我想了解原因。

我做了一个实验,我改成lasso.mod = glmnet(xmat,y, alpha=1,lambda=5)lasso.mod = glmnet(xmat,y, alpha=1,lambda=0.015)结果更接近了。

似乎 predict 函数依赖于grid传递给训练函数的 ,但文档似乎表明s参数 onpredict应该覆盖它。是否存在依赖关系,如果是,它是什么以及如何解决它来处理任意系数s

更新 1:我在glmnet.

警告仅指性能而不是准确性/稳定性,但我尝试改变不同的递减顺序grid,结果predict仍然不同。

0 投票
1 回答
467 浏览

r - R包glmnet中的套索:解决方案不是最优的?

我只是想了解 R 包 glmnet 中实现的套索。我正在拟合数据,但我为我选择的 lambda 得到的解决方案不是最小化套索的标准,例如,如果我以一种方式移动解决方案,我可以获得更小的成本函数。

我理解错了什么?

0 投票
1 回答
5779 浏览

r - glmnet预测方法抛出神秘错误

我正在尝试使用 进行预测glmnet,并收到一条非常神秘的错误消息。我以前在使用时没有遇到过这种情况glmnet,并且谷歌搜索错误没有成果。未注释最后一行时会发生错误。

错误输出:

请注意,更改newx = data.matrix(Hitters.test)newx = model.matrix(Salary~.,Hitters.test)没有帮助。

根据要求,这是sessionInfo()运行前的输出。

这是运行后的输出:

0 投票
2 回答
2841 浏览

python - Python glmnet“没有名为_glmnet的模块”

更新接近。现在我正在运行应该生成模块f2py的文件。.pyf_glmnet

我使用以下命令构建包python-glmnet数据包。

但是当我导入模块时,我得到了这个错误:

文件“/Users/rose/221/tagger/tagger/glmnet/glmnet.py”,第 2 行,在 import _glmnet ImportError: No module named _glmnet

如何导入该模块?

glmnet 目录还包含一个glmnet.pyf以以下内容开头的文件:

更新

我在哪里可以找到这个_glmnet模块?是否包含在 glmnet.pyf 文件中,如下图所示?我尝试将此 glment 文件夹添加到我的PYTHONPATH.,但这并没有改变任何东西。

0 投票
2 回答
1532 浏览

r - 如何将 glmnet 模型保存到 R 中的文件中?

当我使用R时,如何将glmnet构建的模型保存到文件中,然后从文件中读取它以使用它进行预测?

如果我使用 cv.glmnet 来构建模型,是否也一样?

谢谢!

0 投票
2 回答
862 浏览

r - R glmnet:使用多项式和 pmax 时出现分段错误

我使用这个glmnet包来运行多项套索回归。当使用family="multinomial具有p变量和n样本的数据集pmax=x时,如果是奇数,则会发生分段错误x(如果不是pmax>p。在这种情况下,它很可能被忽略,因为它没有影响)。一个例子:

和错误消息:

我的第一个问题是:为什么?这有数学上的原因吗?(我想是这样...)

第二个是:没有比分段错误更好的解决方案吗?......像警告一样?或者只是使用pmax<-pmax-1

编辑:好的,它似乎有点复杂。有时,只有当我第二次为 pmax 执行相同编号的相同命令时,才会发生分段错误。

另外我发现了这个错误

对于 pmax 的偶数和奇数...

现在它对我来说更像是一个错误......或者?

编辑 2:我在 linux 环境(64 位)中使用 glmnet 1.9-5 运行 R 2.15.2 我还在使用 ubuntu 64 位和 R 3.0.2 的另一台 PC 上遇到分段错误

0 投票
2 回答
13255 浏览

r - 'x' 和 'w' 必须具有相同的长度 - weighted.mean.default 中的错误

glmnet在 R 中的包有问题。我正在尝试使用现成的,并遇到以下问题:

weighted.mean.default(y, weights) 中的错误:“x”和“w”必须具有相同的长度

但输入的大小相同:

是什么导致了这个错误?

0 投票
1 回答
1615 浏览

r - 在 R 中嵌套并行函数 (

我熟悉foreach%dopar%之类的。我也parallel熟悉cv.glmnet. 但是您如何设置嵌套并行,如下所示?

并行交叉验证:

不是并行交叉验证:

对于这两个系统时间,我只得到了非常微小的差异。

是并行化的吗?还是我需要明确使用嵌套运算符?

附带问题:如果集群对象中有 8 个内核可用并且foreach循环包含两个任务,每个任务会被分配 1 个内核(其他 6 个内核空闲)还是每个任务会被分配 4 个内核(用完所有 8 个内核总共)?查询在给定时间正在使用多少个内核的方法是什么?

0 投票
2 回答
30021 浏览

r - glmnet NA/NaN/Inf 中的套索错误

我遇到了 glmnet 的问题,因为我不断收到错误消息

下面我可以使用“iris”数据集复制错误,但这里是我的特定数据的简化代码:

这是您可以轻松复制的内容:

非常感谢大家!

0 投票
2 回答
10635 浏览

r - 在 R 中并行执行 cv.glmnet

我的训练数据集有大约 200,000 条记录,我有 500 个特征。(这些是来自零售组织的销售数据)。大多数特征是 0/1,并存储为稀疏矩阵。

目标是预测购买大约 200 种产品的概率。因此,我需要使用相同的 500 个特征来预测 200 种产品的购买概率。由于 glmnet 是创建模型的自然选择,因此我考虑为 200 种产品并行实施 glmnet。(因为所有 200 个模型都是独立的)但是我坚持使用 foreach。我执行的代码是:

model 是一个列表 - 有 200 个模型名称的列表,我想在其中存储相应的模型。

以下代码有效。但它没有利用并行结构,大约需要一天才能完成!

有人可以指出我在这种情况下如何利用并行结构吗?