问题标签 [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何按因子生成随机处理变量?
定义
英石
我有两个级别的处理,1 和 2。我想为每个级别 st 每个班级准确分配一个单位,在随机化之后,我们得到如下结果:
st 单元c和j获得 1 级治疗,e和i获得2 级治疗。
如何在 R 中生成处理向量?
r - 如何将主要因子的数据框转换为数值矩阵;取消列表不起作用
我无法将我的data.frame
转换为矩阵格式。因为我想将我的 data.frame 与主要因素变量更改为数字矩阵,所以我使用了以下代码
但是,当我检查 的模式时UN2010frame
,它仍然显示为列表。因为我要运行的代码(Ordrating)不接受列表格式的数据,所以我曾经UN2010matrix <- unlist(UN2010frame)
取消列出我的矩阵。当我这样做时,我的第一行(以前是带有列名的行)变成了 NA。这对我来说是个问题,因为当我尝试使用此数据集运行有序 IRT 模型时,我收到以下错误消息。
我认为这是因为我第一行中的所有值现在都消失了。
如果您能在任何方面帮助我,将不胜感激。非常感谢!
海莉
r - 未拆分列表,合并因素
我在 R 中有以下数据框:
我然后split
它如下z = lapply(split(test$c1, test$c2), function(x) {cut(x,2)})
: z
然后是:
然后我想通过取消拆分列表来合并这些因素unsplit(z, test$c2)
。这会产生一个警告:
我想将所有因子级别合并,然后取消拆分,以免发生此错误:
在我的真实数据框中,我有一个非常大的列表,所以我需要遍历所有列表元素(不仅仅是两个)。做这个的最好方式是什么?
r - 因子水平和因子标签之间的混淆
R中一个因子的级别和标签之间似乎存在差异。到目前为止,我一直认为级别是因子级别的“真实”名称,标签是用于输出的名称(例如表格和绘图) . 显然,情况并非如此,如以下示例所示:
我认为在编写脚本时仍然可以以某种方式访问级别('a','b','c'),但这不起作用:
但这确实:
所以,我的问题包括两部分:
级别和标签有什么区别?
脚本和输出的因子级别是否可以有不同的名称?
背景:对于较长的脚本,编写具有较短因子级别的脚本似乎要容易得多。但是,对于报告和绘图,这个简短的因子水平可能不够,应该用更精确的名称代替。
r - 在R中任意重新排序直方图列
我想知道如何以对我的数据有意义的方式重新排序直方图的列。这个例子说明了我正在尝试做的事情。
我在文件中有这些数据:
如果我运行这些命令:
我得到了几乎我想要的东西,除了直方图中的列按字母顺序排序,高、低、中,我希望它们以更自然的方式低、中、高排序。
非常感谢您提供有关如何完成此操作的任何指示。
r - 计算 r 中的唯一因子
我想知道在记录的每个出生日期出生的独特水坝的数量。我的数据框类似于这个:
我用过aggregate(dam ~ bdate, data=mydf, FUN=length)
,但它计算了在特定日期分娩的所有水坝
相反,我需要有这样的东西:
非常感激您的帮忙!
r - R:使用因子变量删除逻辑变量中的数据
我制作了以下示例代码,让您了解我的真实数据集。我有 2 个数据集,一个因子变量List
和一个逻辑变量ok
。
List
和变量的ok
长度均为 7。我想删除List
条件为 中的TRUE
所有样本ok
。例如:变量中需要去掉第一个、第五个和第七个List
变量。
谁能帮我这个?
谢谢
r - 为什么在 R 中使用 `as.factor` 绘图时`ann = F` 不起作用?
我正在根据plot()
R 中使用的因子绘制连续变量(参见下面的示例)。我不想要轴上的标签。如果没有as.factor
公式中的调用会ann = F
抑制标签的打印,但它在公式中不起作用as.factor
。
为什么是这样?
谢谢你。
r - 如何将离散因子水平视为连续的?
我有一个数据框,其中的列最初是任意标记的。稍后,我想将这些级别更改为数值。以下脚本说明了该问题。
产生了这个情节。
“可变”量在图上均匀分布,即使在数值上这不是真的。如何获得正确的 x 轴间距?
r - 覆盖 [.data.frame 以默认删除未使用的因子级别
以前出现过在子集时删除未使用的因子水平的问题。常见的解决方案包括通过声明尽可能使用字符向量
然而,有时,有序因子是绘图所必需的,在这种情况下,我们可以使用方便的函数,比如droplevels
为 创建一个包装器subset
:
我意识到这subsetDrop
主要解决了这个问题,但在某些情况下,子集 via[
更方便(而且打字更少!)。
我的问题是,为了方便起见,我们可以通过覆盖[
数据框以自动删除因子级别来推动这成为 R 的“默认”行为。例如,Hmisc 包包含用于子集单个因子的dropUnusedLevels
覆盖[.factor
(不再需要,因为默认值[.factor
似乎有一个drop
用于删除未使用级别的参数)。我正在寻找一个类似的解决方案,它允许我使用[
但自动删除未使用的因子级别(当然在有序因子的情况下保留顺序)对数据帧进行子集化。