问题标签 [r-factor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
16 回答
431707 浏览

r - 在子集数据框中删除未使用的因子水平

我有一个包含factor. 当我使用subset或其他索引函数创建此数据框的子集时,会创建一个新数据框。但是,该factor变量保留其所有原始级别,即使/如果它们不存在于新数据框中。

这在进行多面绘图或使用依赖于因子水平的函数时会导致问题。

从新数据框中的一个因素中删除级别的最简洁的方法是什么?

这是一个例子:

0 投票
4 回答
518 浏览

r - 重命名大 ID

假设我有一个包含 N 行的 data.frame。该id列有 10 个唯一值;所有这些值都是大于 1e7 的整数。我想将它们重命名为编号 1 到 10,并将这些新 ID 作为列保存在我的 data.frame 中。

此外,我想轻松确定 1) idgivenid.new和 2) id.newgiven id

例如:

0 投票
7 回答
96797 浏览

r - 将具有看不见的字符串值的新记录附加到数据帧时,看不见的因子水平会导致警告并导致 NA

我有一个数据框(14.5K 行 x 15 列),其中包含 2001 年到 2007 年的计费数据。

我将新的 2008 年数据附加到它:alltime <- rbind(alltime,all2008)

不幸的是,这会产生警告:

我的猜测是,有一些新患者的名字不在之前的数据框中,因此它不知道给这些患者提供什么级别。同样,在“推荐医生”列中出现了新的看不见的名字。

解决方案是什么?

0 投票
1 回答
9537 浏览

r - 为什么 as.factor 在 apply 内部使用时会返回一个字符?

我想使用以下方法将变量转换为因子apply()

结果是:

我不明白为什么这会导致字符向量而不是因子向量。

0 投票
1 回答
354 浏览

r - stats::reorder vs Hmisc::reorder

我试图绕过stats::reordervs的奇怪重叠Hmisc::reorder

没有Hmisc加载我得到我想要的结果,即一个无序的因素:

现在加载Hmisc结果后是一个有序因子:

在直接调用stats::reorder中,我现在由于某种原因得到了一个有序的因素。

指定我需要一个无序因子会导致错误提示stats::reorder未使用?

所以问题真的是如何在加载 Hmisc 的情况下获得无序因子?

0 投票
9 回答
26206 浏览

r - 如何连接因子而不将它们转换为整数级别?

我很惊讶地看到 R 在连接向量时会将因子强制转换为一个数字。即使级别相同,也会发生这种情况。例如:

在 R 中执行此操作的惯用方法是什么(在我的情况下,这些向量可能非常大)?谢谢你。

0 投票
8 回答
24117 浏览

r - R中的因素:不仅仅是烦恼?

R 中的基本数据类型之一是因子。根据我的经验,因素基本上是一种痛苦,我从不使用它们。我总是转换成字符。我奇怪地觉得我错过了什么。

是否有一些重要的函数示例使用因子作为分组变量,其中因子数据类型变得必要?是否存在我应该使用因子的特定情况?

0 投票
2 回答
218 浏览

r - 在嵌套列表中引用未引用的成员

使用 R,我生成了一个包含某些未引用元素的列表。请在底部查看 - 这是无效的 javascript 代码。

R代码(不起作用)

在 R 语言中,如何引用list$x$ann因子的成员?

当我尝试解析此 JSON 时,json2.js 失败。

示例数据(无效的 JSON)

0 投票
2 回答
1165 浏览

r - 将因子更改为数字 - 如何处理不可用的值

我有一个来自问卷调查的大数据集。将它从 SPSS 导入到 R(使用 SPSS 的 Stata-Output)给了我每个问题的答案作为因素。

一个问题的答案从 1 到 10。但是,有很多缺失值。R 也能识别它们。

但是,现在我想做一些计算 - 例如我想计算答案的平均值(不是很好的统计数据,我知道,没关系)。

所以我必须将因素重新编码为数字。我用as.numeric().

但是,现在我缺少编码为 11 到 14 的值。当然,我无法计算出任何这样的平均值。

将因子重新编码为数字并告诉 R 将任何大于 10 的值设置为 NA 的正确方法是什么?

例:你喜欢吃鱼吗?

0 投票
8 回答
177815 浏览

r - 将 csv 数据集导入到 R 但值成为因素

我对 R 非常陌生,并且无法访问已导入的数据集。我正在使用 RStudio 并在导入我的 csv 文件并将行从控制台窗口粘贴到源窗口时使用了 Import Dataset 函数。代码如下所示:

但是,数据不是我习惯的整数或数字,而是因素,所以当我尝试绘制变量时,我只得到直方图,而不是通常的绘图。在检查数据时,它似乎是有序的,只是我无法使用它,因为它是因子形式。