问题标签 [reshape2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的reshape与reshape2
我试图理解为什么开发已经从包转向reshape
了。reshape2
它们在功能上似乎相同,但是,reshape2
由于服务器上运行的 R 版本较旧,我无法升级到当前版本。我担心一个重大错误的可能性,它会将开发转移到一个全新的包,而不是简单地继续开发reshape
. 有谁知道reshape
包裹是否有重大缺陷?
r - 使用 reshape2 列中的小计
我现在花了一些时间学习reshape2
,plyr
但我仍然不明白。这次我遇到了(a)小计和(b)传递不同聚合函数的问题。这里是一个使用mrdwab 博客上教程中的数据的示例
现在我的问题:
我已经能够在行中添加小计。但是是否也可以在列中添加边距。例如,一个出版商的库存总额?抱歉,我的意思是说所有出版商的总销量示例。“比率”列存在问题。我怎样才能得到这个变量的“平均值”而不是“总和”?
请注意:第一个问题(关于边距小计)可以解决。
PS:我看过一些使用reshape
. 你会推荐使用它来代替reshape2
(这似乎不包括两个函数的功能)。
r - 将多组测量列(宽格式)重塑为单列(长格式)
我有一个宽格式的数据框,在不同的日期范围内进行了重复测量。在我的示例中,有三个不同的时期,它们都有对应的值。例如,第一次测量 ( Value1
) 是在从DateRange1Start
到期间测量的DateRange1End
:
我希望将数据重塑为长格式,以便对 DateRangeXStart 和 DateRangeXEnd 列进行分组。因此,原表中的 1 行变为新表中的 3 行:
我知道必须有一种方法可以使用reshape2
/ melt
/ recast
/来做到这一点tidyr
,但我似乎无法弄清楚如何以这种特定方式将多组度量变量映射到单组值列。
r - 尽管安装并加载了 reshape2,但找不到函数“cast”
遵循 Hadley Wickham在第 2.4 节中的“探索数据和模型的实用工具”示例,我得到了铸造熔融数据Error: could not find function "cast"
。我已经安装并加载了 reshape2 包。
r - 更改强制转换中的默认分隔符
当 cast (dcast) 分配新的列标题时,是否可以更改默认分隔符?
我正在将文件从长转换为宽,我得到以下标题:
在重塑中,您可以像我希望的那样分配“sep”参数(sep="")和列标题输出:
但是,对于超过 200,000 行的数据框,reshape 需要几分钟,而 dcast 需要几秒钟。dcast 还按我想要的顺序输出列,而 reshape 没有。有什么简单的方法可以使用 dcast 更改输出,还是我需要手动更改列标题?
例如:
该示例给出了列标题:
我希望列标题阅读:
我试过了:
dcast 似乎完全忽略了 sep ,因为给出一个符号也不会改变输出。
r - 如何用“重复出现”的列重塑数据框?
我是使用 R 进行数据分析的新手。我最近获得了一个预先格式化的环境观测模型数据集,其示例子集如下所示:
基本上,这些数据包括“重复出现的列”中各个站点的每小时观测和模拟污染物浓度的时间序列,即站点 - obs - mod(在示例中,我只显示了总共 75 个站点中的 2 个)。我将这个“宽”数据集作为数据框读取,并希望将其重塑为“窄”格式:
我相信我应该使用包“reshape2”来做到这一点。首先,我尝试融化然后 dcast 数据集:
但是,它只返回了一半的数据,即第一个(“校园”)之后的站点(“市中心”)的记录都被切断了:
然后我尝试重铸:
但是,它返回错误消息:
我试图搜索以前的问题,但没有找到类似的场景(如果我错了,请纠正我)。有人可以帮我吗?
提前谢谢了!
r - 用重复数据重塑数据框
我有什么应该是一个简单的重塑问题,但我无法弄清楚。我的部分数据如下所示:
或者
我想让它看起来像这样:
等等。我已经尝试过 reshape、cast 和 dcast,就像在这个线程中一样:
但似乎没有任何效果。我真的很感激一些帮助。TIA。
r - dcast 可以在没有聚合函数的情况下使用吗?
可能重复:
这个 R 重塑应该很简单,但是
dcast
来自reshape2
没有公式且没有重复的作品。以这些示例数据为例:
我想要dcast
这些数据,只是将值制成表格,而不对value.var
包括 default 在内的任何函数应用任何函数length
。
在这种情况下,它工作正常。
但是当有重复变量时,fun
默认为length
. 有没有办法避免它?
理想情况下,我正在寻找的是添加一个fun = NA
,因为不要尝试聚合value.var
. dcasting df2 时我想要的结果:
r - 使用多个度量变量重塑数据框
我正在使用与此类似的数据框:
描述学生在五个月内获得的成绩 - 在两个测验中,每个测验分为两个部分。
我需要将两个测验分成不同的行——这样每个月的每个学生都会有两行,每个测验一个,两列——测验的每个部分。当我融化桌子时:
我也将测验的两个部分放在不同的行中。
当然让我回到我开始的地方,我无法找到将表格重新转换为所需形式的方法。有没有办法使熔化命令功能类似于:
r - dcast 函数 (reshape2) 的问题 - 三变量组合
我正在使用 reshape2 包来塑造我的数据并将其用于 t 检验。对我来说,在单独的列中可视化数据更容易。我有三种处理组合,其中“wat”嵌套在“spp”中,“ins”嵌套在水中。我的演示表包含 3 个响应变量,即“tyr”、“esc”和“esc_R”。我很想看看 ins 如何影响响应->“spp”中的“tyr”-> Bl,处理“wat”-> High(只是一个例子)。
这是我的数据: demo.data
然后我在执行 dcast 功能时遇到了麻烦。
我在以下线程中发现了有趣的信息
- Dason 的建议- 与 ToothGrowth 演示数据集配合得非常好。不幸的是,当表格有多个处理(超过 2 个)时,解决方案并不简单。我同意 Maiasaura 的建议,即创建唯一变量是解决此问题的关键。但是,我很难理解 function(x) 的作用或如何在我的表中使用它。
非常感谢这方面的任何帮助。
此外,如果您有其他建议可以在不操纵原始数据框(演示)的情况下进行 t-test,我会很高兴听到它。
提前致谢。
编辑 这是我所期待的,对于“tyr”。在以下格式中,我希望使用 t 检验比较“否”与“是”。