问题标签 [model.matrix]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 强制 model.matrix 遵循 R 中公式中的项的顺序
让我们用假数据创建一个矩阵:
该模型的公式如下:
结果model.matrix
是:
如您所见,列从最低交互等级重新排序到最高。我正在寻找一种强制model.matrix
函数遵循公式中术语的确切顺序的方法。生成的矩阵应如下所示:
r - 是否有现有功能可以为训练数据的子集创建设计矩阵,其中一些对比只有一个级别?
背景
我必须在 Shiny 应用程序中使用我的 glm 对象的清除版本,因为原始模型对象太大。因此,我无法通过该清除对象生成预测的标准误差。相反,我将不得不使用方差-协方差矩阵(我从原始模型对象中获取)来计算预测方差/标准误差。在应用程序中,我动态生成假设的观察结果,我想根据这些观察结果预测结果及其标准误差。
问题
我剩下的问题是创建一个可以乘以 var-cov 矩阵的相应模型矩阵。当我使用 model.matrix() 时,我经常会出错,因为我的假设数据并不总是具有多个因子变量的级别。我意识到我可以硬编码一些逻辑来简单地根据我对模型公式的理解来制作模型矩阵。但这似乎已经有了解决方案。
我使用一个类似迷你鸢尾花的数据集做了一个简单的例子,它抛出了我正在谈论的错误。
r - 将列表中包含因子的列转换为 R 中的模型矩阵
所以我有一个data.frame,我想把它变成一个model.matrix。这一切都在 R 中
这是我所拥有的一个例子:
我想创建以下输出:
我将不胜感激任何建议!我一直在使用 sparse.model.matrix 无济于事,因为它为每个列表创建了唯一的因子列,而不是将它们识别为相似因子的列表。
这是数据开头的 dput() (它要大得多):
期望的输出
r - 如何从 clmm 对象中获取模型矩阵?
我想估计一个多级有序逻辑模型,然后访问模型矩阵。从以下位置运行简化示例时?clmm
:
我收到错误消息Error in eval(predvars, data, env) : object 'SURENESS' not found
。从其他包中,我希望像model = TRUE
输入的数据这样的设置参数也会导出到估计的模型中,但这里所有相关参数似乎都是默认设置的。我是否错过了一些参数或元素mod1
(我通过attributes(mod1)
但没有找到模型矩阵。
奇怪的是,如果我设置一个随机 data.frame,它可以工作:
那么 和 之间有什么区别mod1
以及mod2
如何从中获取 model.matrix mod1
?
r - 使用 model.matrix 函数设计矩阵进行基因表达
需要一些帮助。我的数据如下所示:
样品 1 到 4 是正常的,5 到 10 是异常的。
数据存储在称为 DF 的数据帧中。需要使用 model.matrix 函数创建设计矩阵,其想法是使用此信息来拟合线性模型,以便能够识别差异基因。
我不知道如何创建设计矩阵。我已经阅读了文档,但它让我无处可去。该函数的语法似乎并不适合我所拥有的格式。
任何提示表示赞赏。
r - R design.matrix 问题 - 在设计矩阵中删除列?
在尝试设置设计矩阵以对 RNAseq 数据进行下游成对差异表达分析时,我遇到了一个奇怪的问题。对于设计矩阵,我有捐助者信息和每个条件:
问题是当我形成设计矩阵时,我似乎失去了一个条件(治疗 1),我不知道为什么。
非常感谢您的帮助!
r - 如何在 r 中通过 model.matrix() 传递变量
我正在创建一个执行交叉验证和岭回归的函数,以选择模型的预测变量。我的函数的输入是dataframe
和期望的结果变量outcome
(预测什么)。我正在使用 model.matrix() 创建一个我将传递给 glmnet() 的 x 矩阵。我的函数outcome
在 model.matrix() 中用作对象参数,但看起来outcome
是通过 model.matrix() 的错误数据类型。通常使用 model.matrix(),我会写类似model.matrix(Weight~.,dataframe)
. 但是,在这种情况下,model.matrix 不能用作model.matrix(outcome~.,dataframe)
or model.matrix(dataframe$outcome~.,dataframe)
。有任何想法吗?
r - for 循环的更快替代方案
我有以下问题:
我的数据框如下所示,尽管它更大(20GB):
现在我想为字母创建一个虚拟变量并编写以下 for 循环:
因为我的数据框很大,虽然它需要很长时间才能执行。我尝试的另一个可能的解决方案是:
结果是一样的,但是当我在更大的数据帧上使用它时,它需要更长的时间。
是否有任何可能的替代方案,它们会产生相同的解决方案并且计算速度更快?
非常感谢您!
r - 检查模型是否只有一个因子协变量
我正在编写一个 R 包,其中 main 函数采用一个模型,该模型可能只有一个因子协变量(允许偏移)。为确保用户遵守此规则,我需要对此进行检查。
作为一个例子,让我们看看以下四个模型:
模型1、2 和 3 正常,模型4 和 5 不正常(模型 4 有一个非因子变量trt
,模型 5 有第二个协变量x
)。
如何使用 R 进行检查?最理想的情况是,我会为一个没问题的模型TRUE
和一个FALSE
有问题的模型。
这不仅适用于lm()
and glm()
,而且适用于survreg()
and coxph()
(来自包生存)。可能有用的是查看公式eval(getCall(mod1)$formula)
和数据 ( data
/ datan
)。