问题标签 [plyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在R中重复向量的元素
我正在尝试重复向量 a、b 的元素次数。也就是说,如果 y = 2,a="abc" 应该是 "aabbcc"。
为什么以下任何一个代码示例都不起作用?
从 plyr 包中,
我知道我错过了一些非常明显的东西......
r - 如何使用 ddply 按组对数据进行子采样?
我有一个包含太多行的数据框,无法进行空间相关图。相反,我想为每个物种抓取 40 行并在该子集上运行我的相关图。
我编写了一个函数来对数据框进行子集化,如下所示:
现在我想将此函数应用于更大数据框中的每个物种。
当我尝试类似
我收到此错误:
有人对如何做到这一点有想法吗?
r - 按因子值将数据帧分解为子集,发送到返回 glm 类的函数,如何重组?
感谢 Hadley 的 plyr 包 ddply 函数,我们可以获取一个数据帧,按因子将其分解为子数据帧,将每个子数据帧发送到一个函数,然后将每个子数据帧的函数结果组合成一个新的数据帧。
但是,如果函数返回一个像 glm 这样的类的对象,或者在我的例子中是 ac("glm", "lm")。那么,这些不能组合成一个数据框可以吗?我得到了这个错误
是否有一些更灵活的数据结构可以容纳我的函数调用的所有复杂 glm 类结果,保留有关数据帧子集的信息?
还是应该以完全不同的方式完成?
r - ddply 在函数中运行会在函数外的环境中查找吗?
我正在尝试编写一个函数来进行一些经常重复的分析,其中一部分是计算组数和每个组内的成员数,所以 ddply 救援!但是,我的代码有问题。 ...
这是一些示例数据
这是我的代码
如果我运行这个函数,我会得到一个错误
但是,如果我首先在全局环境中定义我的 exp1、exp2 和数据变量,它就可以工作
所以,我假设 ddply 在函数的 environemtn 之外运行?有没有办法阻止这种情况,或者我做错了什么?
谢谢
保罗。
r - 使用 ddply 分配组 ID
来自 R 新手的非常基本的性能问题。我想通过字段的唯一组合为数据框中的每一行分配一个组 ID。这是我目前的方法:
虽然这适用于行数相对较少或组数较少的数据帧,但我遇到了具有许多唯一组的较大数据集(> 100,000 行)的性能问题。
有什么建议可以提高这项任务的速度吗?可能与 plyr 的实验性 idata.frame() 一起使用?还是我对这一切都错了?
在此先感谢您的帮助。
r - 是否可以在 ddply 中重用生成的列?
我有一个使用 ddply 的脚本,如下例所示:
在 ddply 中,是否可以重用 col1 而无需再次调用整个函数?
例如:
xml - 将不均匀的层次结构列表转换为数据框
我认为这还没有被问到,但是有没有办法将具有多个级别和不均匀结构的列表信息组合成一个“长”格式的数据框?
具体来说:
以下是结构:
我想要的是来自音高类别的命名向量的数据框,以及正确的(top,atbat,bottom)。因此,由于列数不同,我需要忽略不适合 data.frame 的级别。像这样的东西:
有没有一种优雅的方式来做到这一点?谢谢!
r - 根据数据框中的列重塑数据
我需要采用以下格式的data.frame:
并根据start - end
. 例如,第一行需要 3 行,第二行需要 1 行,第三行需要 2 行。开始和结束字段应在最终 data.frame 中按顺序排列。此 data.frame 的最终结果应为:
我编写了这个有效的函数,但不是用非常 R'esque 的代码编写的:
有人对如何优化此代码有建议吗?是否有plyr
可能适用的功能?
list - l_ply:如何将列表的名称属性传递给函数?
假设我有一个这样的 R 列表:
我想使用 处理列表中的每个data.frame l_ply
,但我还需要将名称(例如aug9104AP)与data.frame 一起传递到处理函数中。就像是:
应该arg_to_access_current_list_item_name
是什么?
r - plyr 中的“总结”功能是否仍然存在?
使用 plyr 时,我经常想要 1) 仅对变量的子集执行操作,以及 2) 命名操作的输出。例如:
但这似乎有点笨拙,似乎我应该能够写出类似的东西:
从我读过的内容来看,plyr 中似乎有(或曾经有过?)一个汇总函数,这将允许我编写:
但是,当我尝试使用 summarise 函数时,R 告诉我它不存在。它是否已被重命名或移动到另一个包中?我在 Mac 上使用 plyr 版本 0.1.5(我相信它是最新的——我尝试过更新)。