问题标签 [glmnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 为什么 predict.glmnet 会忽略传递给它的 lambda 值,是否有解决方法让它接受该值?
在下面的代码中,我希望两个打印语句打印相同的结果,因为我明确地将参数传递s
给两个预测函数。
但是,结果非常不同,我想了解原因。
我做了一个实验,我改成lasso.mod = glmnet(xmat,y, alpha=1,lambda=5)
,
lasso.mod = glmnet(xmat,y, alpha=1,lambda=0.015)
结果更接近了。
似乎 predict 函数依赖于grid
传递给训练函数的 ,但文档似乎表明s
参数 onpredict
应该覆盖它。是否存在依赖关系,如果是,它是什么以及如何解决它来处理任意系数s
?
更新 1:我在glmnet
.
警告仅指性能而不是准确性/稳定性,但我尝试改变不同的递减顺序grid
,结果predict
仍然不同。
r - R包glmnet中的套索:解决方案不是最优的?
我只是想了解 R 包 glmnet 中实现的套索。我正在拟合数据,但我为我选择的 lambda 得到的解决方案不是最小化套索的标准,例如,如果我以一种方式移动解决方案,我可以获得更小的成本函数。
我理解错了什么?
r - glmnet预测方法抛出神秘错误
我正在尝试使用 进行预测glmnet
,并收到一条非常神秘的错误消息。我以前在使用时没有遇到过这种情况glmnet
,并且谷歌搜索错误没有成果。未注释最后一行时会发生错误。
错误输出:
请注意,更改newx = data.matrix(Hitters.test)
为newx = model.matrix(Salary~.,Hitters.test)
没有帮助。
根据要求,这是sessionInfo()
运行前的输出。
这是运行后的输出:
python - Python glmnet“没有名为_glmnet的模块”
更新接近。现在我正在运行应该生成模块f2py
的文件。.pyf
_glmnet
我使用以下命令构建包python-glmnet数据包。
但是当我导入模块时,我得到了这个错误:
文件“/Users/rose/221/tagger/tagger/glmnet/glmnet.py”,第 2 行,在 import _glmnet ImportError: No module named _glmnet
如何导入该模块?
glmnet 目录还包含一个glmnet.pyf
以以下内容开头的文件:
更新
我在哪里可以找到这个_glmnet
模块?是否包含在 glmnet.pyf 文件中,如下图所示?我尝试将此 glment 文件夹添加到我的PYTHONPATH
.,但这并没有改变任何东西。
r - 如何将 glmnet 模型保存到 R 中的文件中?
当我使用R时,如何将glmnet构建的模型保存到文件中,然后从文件中读取它以使用它进行预测?
如果我使用 cv.glmnet 来构建模型,是否也一样?
谢谢!
r - R glmnet:使用多项式和 pmax 时出现分段错误
我使用这个glmnet
包来运行多项套索回归。当使用family="multinomial
具有p
变量和n
样本的数据集pmax=x
时,如果是奇数,则会发生分段错误x
(如果不是pmax>p
。在这种情况下,它很可能被忽略,因为它没有影响)。一个例子:
和错误消息:
我的第一个问题是:为什么?这有数学上的原因吗?(我想是这样...)
第二个是:没有比分段错误更好的解决方案吗?......像警告一样?或者只是使用pmax<-pmax-1
编辑:好的,它似乎有点复杂。有时,只有当我第二次为 pmax 执行相同编号的相同命令时,才会发生分段错误。
另外我发现了这个错误
对于 pmax 的偶数和奇数...
现在它对我来说更像是一个错误......或者?
编辑 2:我在 linux 环境(64 位)中使用 glmnet 1.9-5 运行 R 2.15.2 我还在使用 ubuntu 64 位和 R 3.0.2 的另一台 PC 上遇到分段错误
r - 'x' 和 'w' 必须具有相同的长度 - weighted.mean.default 中的错误
我glmnet
在 R 中的包有问题。我正在尝试使用现成的,并遇到以下问题:
weighted.mean.default(y, weights) 中的错误:“x”和“w”必须具有相同的长度
但输入的大小相同:
是什么导致了这个错误?
r - 在 R 中嵌套并行函数 (
我熟悉foreach
,%dopar%
之类的。我也parallel
熟悉cv.glmnet
. 但是您如何设置嵌套并行,如下所示?
并行交叉验证:
不是并行交叉验证:
对于这两个系统时间,我只得到了非常微小的差异。
是并行化的吗?还是我需要明确使用嵌套运算符?
附带问题:如果集群对象中有 8 个内核可用并且foreach
循环包含两个任务,每个任务会被分配 1 个内核(其他 6 个内核空闲)还是每个任务会被分配 4 个内核(用完所有 8 个内核总共)?查询在给定时间正在使用多少个内核的方法是什么?
r - glmnet NA/NaN/Inf 中的套索错误
我遇到了 glmnet 的问题,因为我不断收到错误消息
下面我可以使用“iris”数据集复制错误,但这里是我的特定数据的简化代码:
这是您可以轻松复制的内容:
非常感谢大家!
r - 在 R 中并行执行 cv.glmnet
我的训练数据集有大约 200,000 条记录,我有 500 个特征。(这些是来自零售组织的销售数据)。大多数特征是 0/1,并存储为稀疏矩阵。
目标是预测购买大约 200 种产品的概率。因此,我需要使用相同的 500 个特征来预测 200 种产品的购买概率。由于 glmnet 是创建模型的自然选择,因此我考虑为 200 种产品并行实施 glmnet。(因为所有 200 个模型都是独立的)但是我坚持使用 foreach。我执行的代码是:
model 是一个列表 - 有 200 个模型名称的列表,我想在其中存储相应的模型。
以下代码有效。但它没有利用并行结构,大约需要一天才能完成!
有人可以指出我在这种情况下如何利用并行结构吗?