问题标签 [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将因子值插入 R 矩阵
我有一个表格的矩阵
其中第 1 列是因子,第 2:4 列是整数。
我一直在尝试使用以下形式生成矩阵:
每次我尝试将因子值分配给新矩阵的第二列时,我都会得到数字而不是城市名称,我该如何解决?
r - 使用 ddply 时保留有序因子
我用ddply
的很多。我偶尔使用有序因子。调用ddply
包含有序因子的数据帧会丢弃重组数据帧中的任何排序。
我为该记录级别排序编写了以下包装器ddply
,然后将其重新应用于最初订购的任何列:
我还没有彻底检查过这个功能,所以可能会有它无法处理的情况。有没有更好/更完整的方法来处理这个问题?for
我想,如果我稍微考虑一下,我可能会删除循环。
特别是,我在ddply
调用后检查是否仍然存在任何原始有序因子似乎真的很难看,但我希望该函数能够处理ddply
改变哪些列存在的情况,可能会删除有序因子.
想法?
r - 使用ggplot2时如何更改箱线图的顺序?
这个问题来自另一个问题。我无法在那里实现答案。
定义:
阴谋:
我想以相反的顺序排列箱线图(例如,一个在右边的左边等等)。
我尝试了各种使用levels
, ordered
,relevel
等对因子重新排序的方法rev
,但我似乎根本无法获得正确的语法。
r - R-Graphs:从轴中排除不相关的值
有类似的东西。我有一个包含 22000 个值的数据集,并希望以适当的方式显示它们(使用我的数据:每条河流的图表,y 轴上这条河流中的鱼类种类和 x 上每个物种捕获的鱼的数量-轴。
如果我这样做,图表会在 y 轴上显示所有“鱼名”,仅在这条河中捕获的那些鱼上绘制一个箱线图......我怎样才能摆脱那些没有被捕获的鱼名在这条河中(使图形更好看)?!
有什么建议么?
r - 如何将包含十进制数字的因子列转换为数字?
我有一个 csv 文件,当我使用这个命令时
我得到这个输出
str(SOLK)
结果这个
还有dput(SOLK[1:10,])
这个
如何将SOLK$Close
列从因子转换为数字?
r - 将代码修改为 r 中的批量处理
在被推荐使用 adehabitat 计算交叉路口的体积后,我偶然发现了一个轻微的(希望是简单的)问题。在这个库中,我使用 kerneloverlap 命令,因为我需要计算相交量。我想知道你是否可以帮助我解决一些编程问题。我需要修改脚本以使其“批量”处理友好。我对 R 的了解足以让自己陷入困境并脱发,因为我知道某些事情应该是可能的,但不知道如何让它发挥作用。
该命令非常简单:
它从数据文件 loc 中获取 x、y 坐标,按年份计算,并计算使用分布为 90 的网格单元大小为 30 的交集量。
输入文件(见下文摘录)是 anid、X、Y、年份和季节。对于这个例子,只有 1 个季节(请记住,我有 3 个季节)。对于这个例子,我想在 1 个季节内比较每个单独的交叉量。所以测试数据有2年1季2个人。我想说的是“在 2003 年至 2004 年的产犊季节,动物 1 的交集量为 0.8,这表明高度重叠和对某个位置的忠实度”。
我还想在季节之间进行比较。因此,动物 1 在 2003 年夏季和冬季的交集量为 0.04,这表明重叠程度较低且对位置不保真”。
需要记住的一点是:并非所有人每年都在场或每个季节都活着。因此,可能需要某种 droplevel。
到目前为止,这是我的 R 脚本(它不起作用)。请注意,输出也没有很好地连接在一起,我似乎无法获得编译文件。我希望它告诉我它与哪个年份、个人或季节进行比较。
r - 在 R 中使用数学注释作为因素
我参考了我之前的问题,想了解更多关于factor
R 中的特性。
假设我有一个这样的数据集:
我可以轻松地将标签更改x
为另一个字符:
但是如果我想把它改成一些expression
>=
符号不会在情节中相应改变。我发现class(levels(temp[,"x"]))
是character
,但expression(x>=1)
不是。
如果我想添加一些数学注释作为因子,我该怎么办?
r - 使重复级别在 r 中唯一
我必须根据另一个文件的日期/时间窗口从一个大文件中提取每个人的数据。我有 ID、开始、结束日期作为我的窗口文件和一个包含各种其他数据的大文件 (FULLDATA),但我们将简化它并说它只有 ID、日期、X、Y、Z。
例如,日期窗口数据文件
有重复的 ID,但我需要从中获取数据的唯一时间窗口。
在我的代码中,我需要设置级别
但这样做会使 ID 级别独一无二,并且仅使用第一次显示该级别的窗口。因此,在我的示例中,c1 和 a2 将只使用一次,并从它们的第一次出现中提取信息。
我努力了
但这会将 ID“c1”转换为“c1.1”,这与我其余命令中的 FULLDATA 文件不匹配。
r - 在不丢失信息的情况下将因子转换为数字 R(as.numeric() 似乎不起作用)
以下关于 as.numeric() 函数的事实引起了我的注意
当我使用 as.numeric() 将级别为 4、8、10 和 15 的因子转换为定量变量时,每个数字都会转换为排名,而原始值会丢失。
如何获取具有级别 10、15、4 和 8 的向量“blah.new”,并将其转换为数值 10、15、4 和 8?
(这个问题的出现是因为一个数据集,其中一个定量变量被 read.table() 读取为一个因素)
谢谢!!!!
*****更新:想通了******
但是,我想知道 as.numeric() 的文档中的哪个位置说此函数将参数转换为排名列表?
r - ggplot 不使用子集
我正在使用带有 faceting 选项的 ggplot2 来绘制 data.frame 的多个结果。
这是一个具有三个因素的 data.frame :
- 参与者 (N) 有 6 个级别;
- 条件 (C) 有 6 个级别;
- 具有 10 个条件的刺激 (S)。
我使用子集函数在一种条件下绘制一个参与者的结果,然后用 ggplot 进行刻面。但是,我想知道 ggplot2 中是否有更简单的解决方案?
感谢您的帮助,我目前正在学习 R 和 ggplot2。