问题标签 [model.matrix]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
41 浏览

r - 创建交互项的问题

我有一个包含 7000 行和 36 列的 data.frame。某些列是分类变量。现在我想使用 model.matrix 为回归创建 ax 矩阵。在该矩阵中应该是交互项,例如 (V1*V2*V3)。我试着这样做:

Testaha 是数据框。

在结果测试中只有交互项,如 (V1*V2),没有三阶交互项 (V1*V2*V3) 项。为什么?

0 投票
1 回答
292 浏览

r - 如何从模型矩阵中删除未使用的级别

我创建了一个模型矩阵。一些变量是分类变量。过滤数据后,某些级别不再在数据集中。如何删除未使用的级别?我可以对分类变量应用因子函数吗?

0 投票
2 回答
654 浏览

r - 在 R model.matrix 中专门分配对比

如果我有 2 个级别的变量(条件)并且想要创建一个模型。矩阵 R 会自动将条件B 分配为设计矩阵中的术语。

问题:我希望得到与条件A 相关的结果。如何在 model.matrix() 中指定它?

(一种解决方法是反转生成的 FC)

0 投票
1 回答
909 浏览

r - predict.glmnet:某些因素在新数据中只有一个级别

我已经使用 glmnet 在 R 中训练了一个弹性网络模型,并希望使用它来对新数据集进行预测。

但是我无法生成矩阵以用作 predict() 方法中的参数,因为我在新数据集中的一些因子变量(表示存在合并症的虚拟变量)只有一个级别(从未观察到合并症),这意味着我不能使用

model.matrix(响应 ~ ., new_data)

因为它给了我(预期的)

contrasts<-( , value = contr.funs *tmp*[1 + isOF[nn]]) 中的错误:对比只能应用于具有 2 个或更多级别的因子

我不知道如何解决这个问题。在这种情况下,R 中有没有一种方法可以构造一个合适的矩阵用于 predict(),还是需要在 R 之外准备矩阵?在任何一种情况下,我该怎么做呢?

这是一个重现我遇到的问题的玩具示例:

0 投票
2 回答
216 浏览

r - 合并/cbind模型矩阵

这是我当前问题的简化版本。我需要从 2 个模型矩阵创建一个 model.matrix,而不会丢失“分配”中的信息。例如,考虑数据和公式

和 2 个模型矩阵X1X2使用创建

有没有一种简单的方法可以创建一个具有 1 个截距列的矩阵,X1并且可以从中获得? X2Xattr(,"assign")f1

0 投票
1 回答
43 浏览

r - 一个线性模型矩阵,其中分类的每个级别都与平均值进行对比

我有 xy 数据,其中 y 是连续响应,x 是分类变量:

我想拟合线性模型:y ~ group其中的每个级别df$group都与平均值进行对比。

我认为使用偏差编码可以做到这一点:

但它跳过了对比组 A 的平均值:

是否有任何函数可以构建 a以获取与摘要中的平均值对比的model matrix每个级别?df$group

我能想到的只是手动添加一个“平均”级别df$group并将其设置为使用Dummy Coding的基线:

同样,假设我有两个分类变量的数据:

我想估计每个级别的交互效果:(即class1:groupB,,,class2:groupBclass3:groupB

我将如何获得它?

0 投票
1 回答
313 浏览

r - 如何将公式粘贴到 R 中的 model.matrix 函数中?

通过简化示例,假设您有以下数据:

并且您希望创建以下形式的模型矩阵:

或更优选:

而是将公式粘贴到model.matrix. 我已经尝试了以下方法,但都遇到了错误:

我也尝试过使用更可取的结构:

这个问题有直接的解决方案吗?还是model.matrix功能不利于这种做法?

0 投票
1 回答
1047 浏览

r - model.matrix 错误:$ 运算符对原子向量无效

我在使用“model.matrix”时遇到了这个错误。

是什么导致了问题?

0 投票
1 回答
333 浏览

r - 因子的 R model.matrix 列名

我使用 model.matrix 创建 GLM 使用的矩阵。

有趣的是,result_test 数据的列名是"X.Intercept." "x1B" "x2"

为什么第二列名称不是"x1A"

然后我尝试data_test$x1 <- factor(x = data_test$x1, levels = c("A","B"))了,但它仍然是一样的。

0 投票
1 回答
550 浏览

r - 尝试使用 one_hot 编码时出错

我知道这可能是一个潜在的重复问题,但我发现其他答案在我的情况下不起作用。

我正在使用以下数据集:

我正在尝试使用 one_hot() 将因子编码为二进制,但收到以下错误消息:

错误信息:

我不确定“with”参数是什么,因为我在 R 文档中没有看到它。

我还看到有人建议使用model.matrix。但是,当我使用它时,我的有序因子也会被编码,这是我试图避免的。

这就是我的有序因子变量发生的情况:

我也不确定为什么属性名称后有时会有字母或数字。即教育**.L** 与教育**^5**