问题标签 [plyr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
973 浏览

r - R:根据两列的相似性检查删除列

输入

我有一个删除第 1 行、第 2 行和第 3 行的规则,因为第 1、2 和 3 行的 column2 和 column3 是相同的,但在第 4 列中发现了矛盾的数据(up 和)。 down

我如何要求 R 删除 column2 和 column3 中具有相同名称的那些行,但将第 3 列收缩以产生如下矩阵:

0 投票
2 回答
3241 浏览

r - 使用 ddply 汇总统计信息

我喜欢编写一个函数,使用ddply它输出基于data.frame mat.

  • mat是一个大data.frame的列名"metric", "length", "species", "tree", ...,"index"

  • index是具有 2 个水平的因子"Short", "Long"

  • "metric", "length", "species", "tree"其他都是连续变量

功能:

我希望调用后的输出看起来像这样summary1("metric","length")

目前该功能没有产生所需的输出?这里应该做哪些修改?

谢谢你的帮助。


这是一个玩具示例

0 投票
3 回答
23693 浏览

r - 如何将R中公共列上的两个数据框与其他数据框合并?

Windows 7 上的 R 版本 2.11.1 32 位

我有两个数据集:data_A 和 data_B:

数据_A

数据_B

现在,如果它们的 USER_A 和 USER_B 相等,我想将 data_B 的 ACTION 添加到 data_A 中。如上面的示例,结果将是:

数据_A

那么我该如何实现呢?

0 投票
1 回答
603 浏览

r - ddply 的连续子组

每次条件发生变化时,我都想总结一下我的实验数据。

例如:

我想这样总结一下:

如果像这样使用 ddply:

库(plyr)
ddply(df,c(“temp”),总结,reponse.mean=mean(response)

输出是:

有没有办法做到这一点?

0 投票
4 回答
8267 浏览

r - R Plyr - 从 DDPLY 订购结果?

有谁知道一种巧妙的方法来订购 ddply 汇总操作的结果?

这就是我正在做的事情,以使输出按深度降序排列。

随着输出...

不太难看,但我希望有一种方法可以在 ddply() 中很好地做到这一点。有谁知道怎么做?

Hadley 的 ggplot2 书中有这个 ddply 和子集的示例,但它实际上并没有对输出进行排序,只是选择每组最小的两个钻石。

0 投票
3 回答
2540 浏览

r - 在 ddply 中创建新变量的循环

我正在使用 ddply 来聚合和汇总数据框变量,并且我有兴趣遍历我的数据框列表以创建新变量。

有没有办法让我在 ddply 中插入一个循环,这样我就可以避免写出每个新的汇总变量,例如

我知道这不是它实际的完成方式,但我只是想展示我如何概念化它。有没有办法在我在 ddply 中调用的函数中或通过列表来执行此操作?

更新:因为我是新用户,所以我无法发布我自己的问题的答案:

我的回答涉及尼克的回答和伊斯塔的评论中的想法:

0 投票
6 回答
7335 浏览

r - 为每个组设置前 n 行的数据框,并按变量排序

我想为 n 行子集一个数据框,这些行按一个变量分组,并按另一个变量降序排序。举个例子就清楚了:

我想为每个性别获取 2 行,这些行按年龄降序排列。所需的输出是:

我在这里寻找 order、sort 和其他解决方案,但找不到适合此问题的解决方案。我感谢您的帮助。

0 投票
3 回答
6567 浏览

r - R中的压缩列表

作为指导方针,我更喜欢使用 lapply 或 *ply(来自 plyr)对列表元素应用函数,而不是显式地遍历它们。但是,当我必须一次处理一个列表时,这很有效。当函数接受多个参数时,我通常会做一个循环。

我想知道是否有可能有一个更清洁的结构,在本质上仍然可以使用。一种可能的方法是定义一个类似于 Python 的函数 zip(x,y),它接受输入列表,并返回一个列表,其第 i 个元素是 list(x, y),然后将该函数应用于这个清单。但我的问题是我是否使用最干净的方法。我不担心性能优化,而是担心清晰度/优雅。

下面是一个天真的例子。

这是压缩示例(可以扩展到任意参数):

0 投票
1 回答
3143 浏览

r - 如何使用 dlply 参数调用函数?

我希望编写一个函数dlply来拟合分层的线性回归

所以我的功能看起来像这样

如何编写一个函数,以便当我调用该函数时fun1("cat2")该函数将执行

并调用该函数fun1("cat3"),该函数将执行

其中cat1和是分类变量的名称cat2cat3

感谢您的帮助。

编辑:由于该功能目前,它无法正常工作,因为".(cat1,arg1)"dlply. 需要进行一些修改,但是如何修改?

0 投票
1 回答
893 浏览

r - How does plyr merge two columns of different data.frames with same names but different values

While merging 3 data.frames using plyr library, I encounter some values with the same name but with different values each in different data.frames.

How does the do.call(rbind.fill,list) treat this problem: by arithmetic or geometric average?