“r-factor”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

40870 浏览

r - 在数据框中将因子转换为整数

我有以下代码

我的表最后包含如下数字

等等......

之后我试图只获得符合某些标准的值，例如分数低于特定值

所以我正在做以下事情

所以我想问题是我的表有因子而不是整数

我想我的 anna.total$score 是一个因素，我必须使它成为一个整数

如果我没看错 as.numeric 可能会解决我的问题

我正在阅读 as.numeric 函数，但我不明白如何使用它

因此，您能给我一些建议吗？

先感谢您

最好的问候安娜

PS：我尝试了以下

我又遇到了同样的问题......

2012-02-28T10:41:29.037

0 投票

0 回答

75 浏览

r - 关于如何使用 as.numeric 将因子转换为整数的建议

可能重复：
将因子转换为数据框中的整数

我有以下代码

我的表最后包含如下数字

等等......

之后，我试图只获取符合某些标准的值，例如分数低于特定值

所以我正在做以下事情

所以我想问题是我的表有因子而不是整数

我想我的 anna.total$score 是一个因素，我必须使它成为一个整数

如果我阅读正确，as.numeric可能会解决我的问题

我正在阅读该as.numeric功能，但我不明白如何使用它

因此，您能给我一些建议吗？

r integer dataframe numeric r-factor

2012-02-28T13:10:35.730

0 投票

3 回答

12042 浏览

r - 如何更改因子数据框以便可以对数据框进行箱线图绘制？

我有一个数据框，其中的列包含可变数量的数字和可变数量的 NA。数据框如下所示：

我想从中制作一个箱线图，但是当我这样做时

我得到错误

当我做

我得到以下输出：

那么如何更改我的数据框以使列被视为数字？

r dataframe boxplot r-factor

2012-02-28T17:54:33.803

0 投票

2 回答

1546 浏览

r - 访问第二级列表

我有一个这样的清单

该列表的第一级是一个不断上升的数字。在第二级，我们有以年份作为列名的表。

我想构建列名称为 2005 的第二级所有元素的总和。我该怎么做？

r list r-factor

2012-03-02T15:04:58.743

0 投票

1 回答

790 浏览

r - 公式中的 R 和因子编码

如果我想要自定义值的假人，我如何使用公式界面，例如，如果我想要值 1 和 2，而不是 0 和 1。估计可能如下所示，其中supp是一个因子变量。

在这个例子中，没有太多使用不同的值，但在许多“重写”模型的情况下，它可能很有用。

编辑：实际上，我有 3 个级别，并且希望对两列进行不同的编码，所以一个是 1/0 变量，另一个是 1/2 变量。上面的例子只有两个层次。

r formula r-factor

2012-03-08T11:12:16.153

0 投票

1 回答

8303 浏览

r - ggplot2 中的 geom_boxplot() ：强制出现空级别

我找不到一种方法来要求 ggplot2 在箱线图中显示一个空级别，而不用实际缺失值来估算我的数据框。这是可重现的代码：

所以我想我错过了一些东西。在处理平衡实验时，这不是问题，其中这些缺失的数据可能在数据框中是明确的。但是，例如，对于一个队列中的观察数据，这意味着将数据与未观察到的组合的缺失值相结合......感谢您的帮助。

r ggplot2 boxplot r-factor

2012-03-22T08:43:04.487

0 投票

1 回答

3298 浏览

r - 用 NA 替换不需要的因子水平值

我有一个包含空白缺失值和 NA 的大型数据框。执行 summary(factor(df$col)) 给了我类似的东西

（注意 . 之后的空白50000。）
并且sum(is.na(df$col))是 12476，与 s 的数量相同NA，但我希望它是空白和NAs 的总和。
我试图通过做
levels(df$col) <- c("A", "B", "Blank", "C")
然后尝试为空白创建一个级别df$col <- factor(df$col, exclude="Blank")，它说NA生成了's但我的输出是相同的。有谁知道如何根据因子水平创建 NA 或有更好的解决方案来替换缺失值？我认为问题可能是空格不止一个空格字符，所以它们没有变成NA's 但我不知道如何确认。

r na r-factor

2012-04-08T18:07:43.970

0 投票

1 回答

9259 浏览

r - 用因子替换范围内的数字

给定一个数据框列，它是一系列整数（年龄），我想将整数范围转换为序数变量。

我当前的代码不起作用，我该怎么做？

r data-processing r-factor

2012-04-19T06:08:22.853

0 投票

3 回答

164 浏览

r - 使用动态前零调整数据集中的因子

我有一个很大的data.frame（1.9M 记录，有 20 列）。其中一列是具有不同长度的数字值的因子列（不同数量的字符/数字，例如 567839、234324324、3243211 等）注意：这些是数字代码，没有实际值，也可能只是不同的字符这个例子的长度。

现在我想将 do 因子转换为 13 位因子，这样在位数小于 13 的情况下，因子会在零之前。

例子：

我尝试了不同的方法，但现在我被卡住了。问题是因子的长度在整个数据集中都不同。

我尝试了以下方法，并举了一个例子。

data.frame使用我执行代码的三个不同列进行创建，以识别问题。

问题是代码nchar(as.character(levels(df.test$V1)))不使用向量的长度，df.test$V1而只使用一个值；因子的第一级的长度（在字母/升序上）。它对所有记录执行必要的前面零的数量。所以没有矢量代码！

注意：如果我单独运行“nchar”代码，它会给我一个包含所有记录长度的向量，所以我认为它应该可以工作......

为什么不nchar(as.character(levels(df.test$V1)))作为矢量运算符运行？谁能告诉我如何更改我的代码，以便得到正确的结果？

提前致谢！

注意。请注意，在实际情况下，我只需要对data.frame.

r r-factor

2012-04-24T14:45:11.933

0 投票

2 回答

23855 浏览

r - 在 R 中按星期几重新排序因子水平

我在 R 中有以下 data.frame：

我想更改因子水平的顺序，以便星期按（美国）星期几顺序排列。

看起来我可以用relevel(). 但这仅需要 1 个数字参数并将其移至顶部。所以, relevel(daily$DoW, 7), 星期天移动到顶部，但其余部分保持无序（这意味着我需要以相反的顺序重新调整它）。

可行，但必须有更好的方法，对吧？

（时间序列解决方案也可以接受。）

r dataframe r-factor

2012-04-25T04:58:53.317

问题标签 [r-factor]

Reference