问题标签 [r-factor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3316 浏览

r - 将因子值插入 R 矩阵

我有一个表格的矩阵

其中第 1 列是因子,第 2:4 列是整数。

我一直在尝试使用以下形式生成矩阵:

每次我尝试将因子值分配给新矩阵的第二列时,我都会得到数字而不是城市名称,我该如何解决?

0 投票
1 回答
840 浏览

r - 使用 ddply 时保留有序因子

我用ddply的很多。我偶尔使用有序因子。调用ddply包含有序因子的数据帧会丢弃重组数据帧中的任何排序。

我为该记录级别排序编写了以下包装器ddply,然后将其重新应用于最初订购的任何列:

我还没有彻底检查过这个功能,所以可能会有它无法处理的情况。有没有更好/更完整的方法来处理这个问题?for我想,如果我稍微考虑一下,我可能会删除循环。

特别是,我在ddply调用后检查是否仍然存在任何原始有序因子似乎真的很难看,但我希望该函数能够处理ddply改变哪些列存在的情况,可能会删除有序因子.

想法?

0 投票
2 回答
88614 浏览

r - 使用ggplot2时如何更改箱线图的顺序?

这个问题来自另一个问题。我无法在那里实现答案。

定义:

阴谋:

我想以相反的顺序排列箱线图(例如,一个在右边的左边等等)。

我尝试了各种使用levels, ordered,relevel等对因子重新排序的方法rev,但我似乎根本无法获得正确的语法。

0 投票
1 回答
2039 浏览

r - R-Graphs:从轴中排除不相关的值

有类似的东西。我有一个包含 22000 个值的数据集,并希望以适当的方式显示它们(使用我的数据:每条河流的图表,y 轴上这条河流中的鱼类种类和 x 上每个物种捕获的鱼的数量-轴。

如果我这样做,图表会在 y 轴上显示所有“鱼名”,仅在这条河中捕获的那些鱼上绘制一个箱线图......我怎样才能摆脱那些没有被捕获的鱼名在这条河中(使图形更好看)?!

有什么建议么?

0 投票
4 回答
27168 浏览

r - 如何将包含十进制数字的因子列转换为数字?

我有一个 csv 文件,当我使用这个命令时

我得到这个输出

str(SOLK)结果这个

还有dput(SOLK[1:10,])这个

如何将SOLK$Close列从因子转换为数字?

0 投票
1 回答
110 浏览

r - 将代码修改为 r 中的批量处理

在被推荐使用 adehabitat 计算交叉路口的体积后,我偶然发现了一个轻微的(希望是简单的)问题。在这个库中,我使用 kerneloverlap 命令,因为我需要计算相交量。我想知道你是否可以帮助我解决一些编程问题。我需要修改脚本以使其“批量”处理友好。我对 R 的了解足以让自己陷入困境并脱发,因为我知道某些事情应该是可能的,但不知道如何让它发挥作用。

该命令非常简单:

它从数据文件 loc 中获取 x、y 坐标,按年份计算,并计算使用分布为 90 的网格单元大小为 30 的交集量。

输入文件(见下文摘录)是 anid、X、Y、年份和季节。对于这个例子,只有 1 个季节(请记住,我有 3 个季节)。对于这个例子,我想在 1 个季节内比较每个单独的交叉量。所以测试数据有2年1季2个人。我想说的是“在 2003 年至 2004 年的产犊季节,动物 1 的交集量为 0.8,这表明高度重叠和对某个位置的忠实度”。

我还想在季节之间进行比较。因此,动物 1 在 2003 年夏季和冬季的交集量为 0.04,这表明重叠程度较低且对位置不保真”。

需要记住的一点是:并非所有人每年都在场或每个季节都活着。因此,可能需要某种 droplevel。

到目前为止,这是我的 R 脚本(它不起作用)。请注意,输出也没有很好地连接在一起,我似乎无法获得编译文件。我希望它告诉我它与哪个年份、个人或季节进行比较。

0 投票
3 回答
1492 浏览

r - 在 R 中使用数学注释作为因素

我参考了我之前的问题,想了解更多关于factorR 中的特性。

假设我有一个这样的数据集:

我可以轻松地将标签更改x为另一个字符:

但是如果我想把它改成一些expression

>=符号不会在情节中相应改变。我发现class(levels(temp[,"x"]))character,但expression(x>=1)不是。

如果我想添加一些数学注释作为因子,我该怎么办?

0 投票
1 回答
915 浏览

r - 使重复级别在 r 中唯一

我必须根据另一个文件的日期/时间窗口从一个大文件中提取每个人的数据。我有 ID、开始、结束日期作为我的窗口文件和一个包含各种其他数据的大文件 (FULLDATA),但我们将简化它并说它只有 ID、日期、X、Y、Z。

例如,日期窗口数据文件

有重复的 ID,但我需要从中获取数据的唯一时间窗口。

在我的代码中,我需要设置级别

但这样做会使 ID 级别独一无二,并且仅使用第一次显示该级别的窗口。因此,在我的示例中,c1 和 a2 将只使用一次,并从它们的第一次出现中提取信息。

我努力了

但这会将 ID“c1”转换为“c1.1”,这与我其余命令中的 FULLDATA 文件不匹配。

0 投票
1 回答
118611 浏览

r - 在不丢失信息的情况下将因子转换为数字 R(as.numeric() 似乎不起作用)

可能重复:
R - 如何在不丢失信息的情况下将因子转换为 R 中的整数\数字

以下关于 as.numeric() 函数的事实引起了我的注意

当我使用 as.numeric() 将级别为 4、8、10 和 15 的因子转换为定量变量时,每个数字都会转换为排名,而原始值会丢失。

如何获取具有级别 10、15、4 和 8 的向量“blah.new”,并将其转换为数值 10、15、4 和 8?

(这个问题的出现是因为一个数据集,其中一个定量变量被 read.table() 读取为一个因素)

谢谢!!!!

*****更新:想通了******

但是,我想知道 as.numeric() 的文档中的哪个位置说此函数将参数转换为排名列表?

0 投票
1 回答
702 浏览

r - ggplot 不使用子集

我正在使用带有 faceting 选项的 ggplot2 来绘制 data.frame 的多个结果。

这是一个具有三个因素的 data.frame :

  • 参与者 (N) 有 6 个级别;
  • 条件 (C) 有 6 个级别;
  • 具有 10 个条件的刺激 (S)。

我使用子集函数在一种条件下绘制一个参与者的结果,然后用 ggplot 进行刻面。但是,我想知道 ggplot2 中是否有更简单的解决方案?

感谢您的帮助,我目前正在学习 R 和 ggplot2。