问题标签 [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在数据框中将因子转换为整数
我有以下代码
我的表最后包含如下数字
等等......
之后我试图只获得符合某些标准的值,例如分数低于特定值
所以我正在做以下事情
所以我想问题是我的表有因子而不是整数
我想我的 anna.total$score 是一个因素,我必须使它成为一个整数
如果我没看错 as.numeric 可能会解决我的问题
我正在阅读 as.numeric 函数,但我不明白如何使用它
因此,您能给我一些建议吗?
先感谢您
最好的问候安娜
PS:我尝试了以下
我又遇到了同样的问题......
r - 关于如何使用 as.numeric 将因子转换为整数的建议
可能重复:
将因子转换为数据框中的整数
我有以下代码
我的表最后包含如下数字
等等......
之后,我试图只获取符合某些标准的值,例如分数低于特定值
所以我正在做以下事情
所以我想问题是我的表有因子而不是整数
我想我的 anna.total$score 是一个因素,我必须使它成为一个整数
如果我阅读正确,as.numeric
可能会解决我的问题
我正在阅读该as.numeric
功能,但我不明白如何使用它
因此,您能给我一些建议吗?
r - 如何更改因子数据框以便可以对数据框进行箱线图绘制?
我有一个数据框,其中的列包含可变数量的数字和可变数量的 NA。数据框如下所示:
我想从中制作一个箱线图,但是当我这样做时
我得到错误
当我做
我得到以下输出:
那么如何更改我的数据框以使列被视为数字?
r - 访问第二级列表
我有一个这样的清单
该列表的第一级是一个不断上升的数字。在第二级,我们有以年份作为列名的表。
我想构建列名称为 2005 的第二级所有元素的总和。我该怎么做?
r - 公式中的 R 和因子编码
如果我想要自定义值的假人,我如何使用公式界面,例如,如果我想要值 1 和 2,而不是 0 和 1。估计可能如下所示,其中supp
是一个因子变量。
在这个例子中,没有太多使用不同的值,但在许多“重写”模型的情况下,它可能很有用。
编辑:实际上,我有 3 个级别,并且希望对两列进行不同的编码,所以一个是 1/0 变量,另一个是 1/2 变量。上面的例子只有两个层次。
r - ggplot2 中的 geom_boxplot() :强制出现空级别
我找不到一种方法来要求 ggplot2 在箱线图中显示一个空级别,而不用实际缺失值来估算我的数据框。这是可重现的代码:
所以我想我错过了一些东西。在处理平衡实验时,这不是问题,其中这些缺失的数据可能在数据框中是明确的。但是,例如,对于一个队列中的观察数据,这意味着将数据与未观察到的组合的缺失值相结合......感谢您的帮助。
r - 用 NA 替换不需要的因子水平值
我有一个包含空白缺失值和 NA 的大型数据框。执行 summary(factor(df$col)) 给了我类似的东西
(注意 . 之后的空白50000
。)
并且sum(is.na(df$col))
是 12476,与 s 的数量相同NA
,但我希望它是空白和NA
s 的总和。
我试图通过做
levels(df$col) <- c("A", "B", "Blank", "C")
然后尝试为空白创建一个级别df$col <- factor(df$col, exclude="Blank")
,它说NA
生成了's但我的输出是相同的。有谁知道如何根据因子水平创建 NA 或有更好的解决方案来替换缺失值?我认为问题可能是空格不止一个空格字符,所以它们没有变成NA
's 但我不知道如何确认。
r - 用因子替换范围内的数字
给定一个数据框列,它是一系列整数(年龄),我想将整数范围转换为序数变量。
我当前的代码不起作用,我该怎么做?
r - 使用动态前零调整数据集中的因子
我有一个很大的data.frame
(1.9M 记录,有 20 列)。其中一列是具有不同长度的数字值的因子列(不同数量的字符/数字,例如 567839、234324324、3243211 等)注意:这些是数字代码,没有实际值,也可能只是不同的字符这个例子的长度。
现在我想将 do 因子转换为 13 位因子,这样在位数小于 13 的情况下,因子会在零之前。
例子:
我尝试了不同的方法,但现在我被卡住了。问题是因子的长度在整个数据集中都不同。
我尝试了以下方法,并举了一个例子。
data.frame
使用我执行代码的三个不同列进行创建,以识别问题。
问题是代码nchar(as.character(levels(df.test$V1)))
不使用向量的长度,df.test$V1
而只使用一个值;因子的第一级的长度(在字母/升序上)。它对所有记录执行必要的前面零的数量。所以没有矢量代码!
注意:如果我单独运行“nchar”代码,它会给我一个包含所有记录长度的向量,所以我认为它应该可以工作......
为什么不nchar(as.character(levels(df.test$V1)))
作为矢量运算符运行?谁能告诉我如何更改我的代码,以便得到正确的结果?
提前致谢!
注意。请注意,在实际情况下,我只需要对data.frame
.
r - 在 R 中按星期几重新排序因子水平
我在 R 中有以下 data.frame:
我想更改因子水平的顺序,以便星期按(美国)星期几顺序排列。
看起来我可以用relevel()
. 但这仅需要 1 个数字参数并将其移至顶部。所以, relevel(daily$DoW, 7)
, 星期天移动到顶部,但其余部分保持无序(这意味着我需要以相反的顺序重新调整它)。
可行,但必须有更好的方法,对吧?
(时间序列解决方案也可以接受。)