问题标签 [model.matrix]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 创建交互项的问题
我有一个包含 7000 行和 36 列的 data.frame。某些列是分类变量。现在我想使用 model.matrix 为回归创建 ax 矩阵。在该矩阵中应该是交互项,例如 (V1*V2*V3)。我试着这样做:
Testaha 是数据框。
在结果测试中只有交互项,如 (V1*V2),没有三阶交互项 (V1*V2*V3) 项。为什么?
r - 如何从模型矩阵中删除未使用的级别
我创建了一个模型矩阵。一些变量是分类变量。过滤数据后,某些级别不再在数据集中。如何删除未使用的级别?我可以对分类变量应用因子函数吗?
r - 在 R model.matrix 中专门分配对比
如果我有 2 个级别的变量(条件)并且想要创建一个模型。矩阵 R 会自动将条件B 分配为设计矩阵中的术语。
问题:我希望得到与条件A 相关的结果。如何在 model.matrix() 中指定它?
(一种解决方法是反转生成的 FC)
r - predict.glmnet:某些因素在新数据中只有一个级别
我已经使用 glmnet 在 R 中训练了一个弹性网络模型,并希望使用它来对新数据集进行预测。
但是我无法生成矩阵以用作 predict() 方法中的参数,因为我在新数据集中的一些因子变量(表示存在合并症的虚拟变量)只有一个级别(从未观察到合并症),这意味着我不能使用
model.matrix(响应 ~ ., new_data)
因为它给了我(预期的)
contrasts<-
( , value = contr.funs*tmp*
[1 + isOF[nn]]) 中的错误:对比只能应用于具有 2 个或更多级别的因子
我不知道如何解决这个问题。在这种情况下,R 中有没有一种方法可以构造一个合适的矩阵用于 predict(),还是需要在 R 之外准备矩阵?在任何一种情况下,我该怎么做呢?
这是一个重现我遇到的问题的玩具示例:
r - 合并/cbind模型矩阵
这是我当前问题的简化版本。我需要从 2 个模型矩阵创建一个 model.matrix,而不会丢失“分配”中的信息。例如,考虑数据和公式
和 2 个模型矩阵X1
并X2
使用创建
有没有一种简单的方法可以创建一个具有 1 个截距列的矩阵,X1
并且可以从中获得? X2
X
attr(,"assign")
f1
r - 一个线性模型矩阵,其中分类的每个级别都与平均值进行对比
我有 xy 数据,其中 y 是连续响应,x 是分类变量:
我想拟合线性模型:y ~ group
其中的每个级别df$group
都与平均值进行对比。
我认为使用偏差编码可以做到这一点:
但它跳过了对比组 A 的平均值:
是否有任何函数可以构建 a以获取与摘要中的平均值对比的model matrix
每个级别?df$group
我能想到的只是手动添加一个“平均”级别df$group
并将其设置为使用Dummy Coding的基线:
同样,假设我有两个分类变量的数据:
我想估计每个级别的交互效果:(即class1:groupB
,,,class2:groupB
和class3:groupB
:
我将如何获得它?
r - 如何将公式粘贴到 R 中的 model.matrix 函数中?
通过简化示例,假设您有以下数据:
并且您希望创建以下形式的模型矩阵:
或更优选:
而是将公式粘贴到model.matrix
. 我已经尝试了以下方法,但都遇到了错误:
我也尝试过使用更可取的结构:
这个问题有直接的解决方案吗?还是model.matrix
功能不利于这种做法?
r - model.matrix 错误:$ 运算符对原子向量无效
我在使用“model.matrix”时遇到了这个错误。
是什么导致了问题?
r - 因子的 R model.matrix 列名
我使用 model.matrix 创建 GLM 使用的矩阵。
有趣的是,result_test 数据的列名是"X.Intercept." "x1B" "x2"
为什么第二列名称不是"x1A"
?
然后我尝试data_test$x1 <- factor(x = data_test$x1, levels = c("A","B"))
了,但它仍然是一样的。
r - 尝试使用 one_hot 编码时出错
我知道这可能是一个潜在的重复问题,但我发现其他答案在我的情况下不起作用。
我正在使用以下数据集:
我正在尝试使用 one_hot() 将因子编码为二进制,但收到以下错误消息:
错误信息:
我不确定“with”参数是什么,因为我在 R 文档中没有看到它。
我还看到有人建议使用model.matrix。但是,当我使用它时,我的有序因子也会被编码,这是我试图避免的。
这就是我的有序因子变量发生的情况:
我也不确定为什么属性名称后有时会有字母或数字。即教育**.L** 与教育**^5**