问题标签 [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 因子与有序因子?
这是我要解决的问题。我正在使用库中的burn
数据集,KMsurv
并且试图用两个简单的协变量拟合一个简单的生存模型。这些预测因子之一是有序因子。也许我的问题是一个幼稚的问题,当我查看结果时,我看到了我估计L
的Q
系数前面的单词。做L
并Q
参考线性和二次?与调整未排序的相同因子相比,当我调整有序因子时,我希望看到相同数量的估计系数,但估计值不同。您能否指导我了解我的合身结果意味着什么(那些 coeffQ
和L
) 以及它们应该如何解释?如果您还可以向我推荐参考资料以了解有关调整有序因子的更多信息,我将不胜感激。这是我的代码:
谢谢你的帮助。
r - 如何为每个观察调用变量的因子水平,并使用这些值在 R 中创建一个新变量?
我有一个hospital_code
包含 10 个级别的分类变量的数据集。
我正在运行的程序循环并获取数据的一个子集,以便该变量compLbl
恰好包含 10 个医院代码中的 2 个,以便可以将它们相互比较。我现在有一种情况,在每个循环中,我需要对 compLbl 进行二进制编码(1s 和 0s)。
如果我只是从第一个循环中获取子集数据,其中 compLbl 的可能值为AMH
和BJH
,我可以轻松地执行以下操作:
并获取如下所示的数据:
我如何概括这一点,以便无论其中有什么两个值都会对compLbl
它们进行二进制编码?我的想法是可能通过为因子变量 compLbl 中存在的任何两个值引用因子级别 1 来做到这一点。像这样:
在我上面的示例中,FACTORLEVEL(compLbl)
将返回 1AMH
和 2,BHC
因为这些是 R 将自动分配的因子水平。但是,我不确定如何执行此操作,或者是否可能。
r - 为什么 rle 不接受一个因子作为输入?
我无法rle
在data.frame
. 函数在另一组上效果很好:
这会产生错误:
样本数据:
数据结构:
我知道我有factor
s,但将factor
s 转换为numeric
with
或者:
不能解决我的问题:
data.frame
这是该rle
函数工作的示例:
我发现了一个非常“不优雅”的解决方法。data.frame
以 CSV 格式写入文件并使用stringsAsFactors = FALSE
. 这不是我想在我的代码中写的......必须有一种更简单的方法来重新排列的结构data.frame
来取悦rle
?
r - 带有有序因子的 tapply
当缺少因子水平时,您可以通过以下方式使用表:
这将返回一个以零频率列出的级别为“2”的表。
如果有一组与“分数”相关联的“分数”并且没有缺失的级别(这里是 2),tapply
则可以用于生成每个级别的分数总和。
tapply 可以适应“缺失”因子水平的情况吗?或者,还有更好的方法?
r - 错误:连续值提供给带有因子的离散比例
我得到了这个data.frame
绘制这样的 ggplot 有效:
然而不是这样
错误发生在 geom_smooth 中,这是完整的代码
编辑:
包含工资的会话文件: session08.rda
PS:我需要设置因子水平,因为智商水平应该是自定义的
r - 在 lme4 中排除一个因素水平的交互作用计算
我正在使用 制作混合模型,lme4
其中包括 2,3 和 4 个级别的三个因子(S、M、R)。但是我缺少对 S3:M2:R1 的观察,所以我无法检查三向交互。
有没有办法告诉lme4
忽略估计这个级别的参数?
而不是它给我的信息:Error in mer_finalize(ans) : Downdated X'X is not positive definite, 21.
r - 如何将数据框的某些列转换为因子?
可能重复:
使用 R 识别或编码独特因素
我在使用 R 时遇到了一些问题。
我有一个类似于以下的数据集,但要长得多。
基本上,前 2 列已编码。A
有 1, 2 代表 2 个不同的权重。
B
有 1, 2, 3 代表 3 个不同的时间。
由于它们是编码的数值,R 会将它们视为数值变量。我需要使用因子函数将这些变量转换为因子。
帮助?
r - 如何通过数据框中的因素用 LOCF 填充 NA,按国家/地区划分
我有以下数据框(简化),其中国家变量作为一个因素,值变量有缺失值:
下面生成上述数据框:
现在,我想使用最后一次观察结转方法 (LOCF) 替换每个国家/地区子集中的 NA 值。我知道zoo包na.locf
中的命令。会给我以下数据框:data <- na.locf(data)
但是,该函数只能用于由 country 拆分的各个子集。以下是我需要的输出:
我想不出一个简单的方法来实现它。在开始使用 for 循环之前,我想知道是否有人知道如何解决这个问题。
非常感谢!!
r - 如何在没有观察的情况下降低因子水平?
可能重复:
在 R 中的子集数据框中删除因子级别
我有一个包含几个变量的数据框,我正在使用lme()
. 其中一个变量 ForAgeCat 有五个因子水平:1、2、3、4、5。
问题是因子级别 3 实际上不存在,也就是说,在这个数据集(它是更大数据集的一个子集)中,没有来自因子级别 3 的观察结果,我认为这会干扰我在 lme() 中的建模. 有人可以帮我从因子级别列表中删除/消除因子级别 3 吗?
r - 错误:L-BFGS-B 需要有限的“fn”值
我有一个相关矩阵,当我尝试使用“factanal”函数对其进行最大似然因子分析时,出现以下错误:
这可能是什么原因造成的?