问题标签 [r-factor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3247 浏览

r - 如何按因子生成随机处理变量?

定义

英石

我有两个级别的处理,1 和 2。我想为每个级别 st 每个班级准确分配一个单位,在随机化之后,我们得到如下结果:

st 单元cj获得 1 级治疗,ei获得2 级治疗。

如何在 R 中生成处理向量?

0 投票
2 回答
2577 浏览

r - 如何将主要因子的数据框转换为数值矩阵;取消列表不起作用

我无法将我的data.frame转换为矩阵格式。因为我想将我的 data.frame 与主要因素变量更改为数字矩阵,所以我使用了以下代码

但是,当我检查 的模式时UN2010frame,它仍然显示为列表。因为我要运行的代码(Ordrating)不接受列表格式的数据,所以我曾经UN2010matrix <- unlist(UN2010frame)取消列出我的矩阵。当我这样做时,我的第一行(以前是带有列名的行)变成了 NA。这对我来说是个问题,因为当我尝试使用此数据集运行有序 IRT 模型时,我收到以下错误消息。

我认为这是因为我第一行中的所有值现在都消失了。

如果您能在任何方面帮助我,将不胜感激。非常感谢!

海莉

0 投票
2 回答
2495 浏览

r - 未拆分列表,合并因素

我在 R 中有以下数据框:

我然后split它如下z = lapply(split(test$c1, test$c2), function(x) {cut(x,2)}) z然后是:

然后我想通过取消拆分列表来合并这些因素unsplit(z, test$c2)。这会产生一个警告:

我想将所有因子级别合并,然后取消拆分,以免发生此错误:

在我的真实数据框中,我有一个非常大的列表,所以我需要遍历所有列表元素(不仅仅是两个)。做这个的最好方式是什么?

0 投票
3 回答
94590 浏览

r - 因子水平和因子标签之间的混淆

R中一个因子的级别和标签之间似乎存在差异。到目前为止,我一直认为级别是因子级别的“真实”名称,标签是用于输出的名称(例如表格和绘图) . 显然,情况并非如此,如以下示例所示:

我认为在编写脚本时仍然可以以某种方式访问​​级别('a','b','c'),但这不起作用:

但这确实:

所以,我的问题包括两部分:

  • 级别和标签有什么区别?

  • 脚本和输出的因子级别是否可以有不同的名称?

背景:对于较长的脚本,编写具有较短因子级别的脚本似乎要容易得多。但是,对于报告和绘图,这个简短的因子水平可能不够,应该用更精确的名称代替。

0 投票
1 回答
2026 浏览

r - 在R中任意重新排序直方图列

我想知道如何以对我的数据有意义的方式重新排序直方图的列。这个例子说明了我正在尝试做的事情。

我在文件中有这些数据:

如果我运行这些命令:

我得到了几乎我想要的东西,除了直方图中的列按字母顺序排序,高、低、中,我希望它们以更自然的方式低、中、高排序。

非常感谢您提供有关如何完成此操作的任何指示。

0 投票
4 回答
11981 浏览

r - 计算 r 中的唯一因子

我想知道在记录的每个出生日期出生的独特水坝的数量。我的数据框类似于这个:

我用过aggregate(dam ~ bdate, data=mydf, FUN=length),但它计算了在特定日期分娩的所有水坝

相反,我需要有这样的东西:

非常感激您的帮忙!

0 投票
2 回答
897 浏览

r - R:使用因子变量删除逻辑变量中的数据

我制作了以下示例代码,让您了解我的真实数据集。我有 2 个数据集,一个因子变量List和一个逻辑变量ok

List和变量的ok长度均为 7。我想删除List条件为 中的TRUE所有样本ok。例如:变量中需要去掉第一个、第五个和第七个List变量。

谁能帮我这个?

谢谢

0 投票
2 回答
1824 浏览

r - 为什么在 R 中使用 `as.factor` 绘图时`ann = F` 不起作用?

我正在根据plot()R 中使用的因子绘制连续变量(参见下面的示例)。我不想要轴上的标签。如果没有as.factor公式中的调用会ann = F抑制标签的打印,但它在公式中不起作用as.factor

为什么是这样?

谢谢你。

0 投票
2 回答
59948 浏览

r - 如何将离散因子水平视为连续的?

我有一个数据框,其中的列最初是任意标记的。稍后,我想将这些级别更改为数值。以下脚本说明了该问题。

产生了这个情节。

在此处输入图像描述

“可变”量在图上均匀分布,即使在数值上这不是真的。如何获得正确的 x 轴间距?

0 投票
3 回答
1223 浏览

r - 覆盖 [.data.frame 以默认删除未使用的因子级别

以前出现过在子集时删除未使用的因子水平的问题。常见的解决方案包括通过声明尽可能使用字符向量

然而,有时,有序因子是绘图所必需的,在这种情况下,我们可以使用方便的函数,比如droplevels为 创建一个包装器subset

我意识到这subsetDrop主要解决了这个问题,但在某些情况下,子集 via[更方便(而且打字更少!)。

我的问题是,为了方便起见,我们可以通过覆盖[数据框以自动删除因子级别来推动这成为 R 的“默认”行为。例如,Hmisc 包包含用于子集单个因子的dropUnusedLevels覆盖[.factor(不再需要,因为默认值[.factor似乎有一个drop用于删除未使用级别的参数)。我正在寻找一个类似的解决方案,它允许我使用[但自动删除未使用的因子级别(当然在有序因子的情况下保留顺序)对数据帧进行子集化。