问题标签 [r-factor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
40870 浏览

r - 在数据框中将因子转换为整数

我有以下代码

我的表最后包含如下数字

等等......

之后我试图只获得符合某些标准的值,例如分数低于特定值

所以我正在做以下事情

所以我想问题是我的表有因子而不是整数

我想我的 anna.total$score 是一个因素,我必须使它成为一个整数

如果我没看错 as.numeric 可能会解决我的问题

我正在阅读 as.numeric 函数,但我不明白如何使用它

因此,您能给我一些建议吗?

先感谢您

最好的问候安娜

PS:我尝试了以下

我又遇到了同样的问题......

0 投票
0 回答
75 浏览

r - 关于如何使用 as.numeric 将因子转换为整数的建议

可能重复:
将因子转换为数据框中的整数

我有以下代码

我的表最后包含如下数字

等等......

之后,我试图只获取符合某些标准的值,例如分数低于特定值

所以我正在做以下事情

所以我想问题是我的表有因子而不是整数

我想我的 anna.total$score 是一个因素,我必须使它成为一个整数

如果我阅读正确,as.numeric可能会解决我的问题

我正在阅读该as.numeric功能,但我不明白如何使用它

因此,您能给我一些建议吗?

0 投票
3 回答
12042 浏览

r - 如何更改因子数据框以便可以对数据框进行箱线图绘制?

我有一个数据框,其中的列包含可变数量的数字和可变数量的 NA。数据框如下所示:

我想从中制作一个箱线图,但是当我这样做时

我得到错误

当我做

我得到以下输出:

那么如何更改我的数据框以使列被视为数字?

0 投票
2 回答
1546 浏览

r - 访问第二级列表

我有一个这样的清单

该列表的第一级是一个不断上升的数字。在第二级,我们有以年份作为列名的表。

我想构建列名称为 2005 的第二级所有元素的总和。我该怎么做?

0 投票
1 回答
790 浏览

r - 公式中的 R 和因子编码

如果我想要自定义值的假人,我如何使用公式界面,例如,如果我想要值 1 和 2,而不是 0 和 1。估计可能如下所示,其中supp是一个因子变量。

在这个例子中,没有太多使用不同的值,但在许多“重写”模型的情况下,它可能很有用。

编辑:实际上,我有 3 个级别,并且希望对两列进行不同的编码,所以一个是 1/0 变量,另一个是 1/2 变量。上面的例子只有两个层次。

0 投票
1 回答
8303 浏览

r - ggplot2 中的 geom_boxplot() :强制出现空级别

我找不到一种方法来要求 ggplot2 在箱线图中显示一个空级别,而不用实际缺失值来估算我的数据框。这是可重现的代码:

所以我想我错过了一些东西。在处理平衡实验时,这不是问题,其中这些缺失的数据可能在数据框中是明确的。但是,例如,对于一个队列中的观察数据,这意味着将数据与未观察到的组合的缺失值相结合......感谢您的帮助。

0 投票
1 回答
3298 浏览

r - 用 NA 替换不需要的因子水平值

我有一个包含空白缺失值和 NA 的大型数据框。执行 summary(factor(df$col)) 给了我类似的东西

(注意 . 之后的空白50000。)
并且sum(is.na(df$col))是 12476,与 s 的数量相同NA,但我希望它是空白和NAs 的总和。
我试图通过做
levels(df$col) <- c("A", "B", "Blank", "C")
然后尝试为空白创建一个级别df$col <- factor(df$col, exclude="Blank"),它说NA生成了's但我的输出是相同的。有谁知道如何根据因子水平创建 NA 或有更好的解决方案来替换缺失值?我认为问题可能是空格不止一个空格字符,所以它们没有变成NA's 但我不知道如何确认。

0 投票
1 回答
9259 浏览

r - 用因子替换范围内的数字

给定一个数据框列,它是一系列整数(年龄),我想将整数范围转换为序数变量。

我当前的代码不起作用,我该怎么做?

0 投票
3 回答
164 浏览

r - 使用动态前零调整数据集中的因子

我有一个很大的data.frame(1.9M 记录,有 20 列)。其中一列是具有不同长度的数字值的因子列(不同数量的字符/数字,例如 567839、234324324、3243211 等)注意:这些是数字代码,没有实际值,也可能只是不同的字符这个例子的长度。

现在我想将 do 因子转换为 13 位因子,这样在位数小于 13 的情况下,因子会在零之前。

例子:

我尝试了不同的方法,但现在我被卡住了。问题是因子的长度在整个数据集中都不同。

我尝试了以下方法,并举了一个例子。

data.frame使用我执行代码的三个不同列进行创建,以识别问题。

问题是代码nchar(as.character(levels(df.test$V1)))不使用向量的长度,df.test$V1而只使用一个值;因子的第一级的长度(在字母/升序上)。它对所有记录执行必要的前面零的数量。所以没有矢量代码!

注意:如果我单独运行“nchar”代码,它会给我一个包含所有记录长度的向量,所以我认为它应该可以工作......

为什么不nchar(as.character(levels(df.test$V1)))作为矢量运算符运行?谁能告诉我如何更改我的代码,以便得到正确的结果?

提前致谢!

注意。请注意,在实际情况下,我只需要对data.frame.

0 投票
2 回答
23855 浏览

r - 在 R 中按星期几重新排序因子水平

我在 R 中有以下 data.frame:

我想更改因子水平的顺序,以便星期按(美国)星期几顺序排列。

看起来我可以用relevel(). 但这仅需要 1 个数字参数并将其移至顶部。所以, relevel(daily$DoW, 7), 星期天移动到顶部,但其余部分保持无序(这意味着我需要以相反的顺序重新调整它)。

可行,但必须有更好的方法,对吧?

(时间序列解决方案也可以接受。)