问题标签 [dplyr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
778 浏览

r - dplyr 和可重用的参数列表

我玩过dplyr一点,真的很喜欢。我错过了一些东西。在plyr中,我能够将函数传递给ddply并重用它。

因此,我可以将一长串录音应用到多个数据集,而无需将所有参数复制到summarise. 但是dplyr,我必须这样做

summarise因此,每次都必须重复这些论点。带有list('.data'=DF1,'count'=length(id))and的参数列表do.call也不起作用,因为length(id)在我定义参数列表时会对其进行评估。有什么解决方案吗?

0 投票
1 回答
4021 浏览

r - 使用 dplyr 从不同的 data.frame 中提取数据?

我有一个名为 dat_new 的数据框,本质上它是诊所就诊数据,hrn 是患者 ID,dov 是就诊日期(每人多次就诊)。然后我有一个名为 event 的数据框,其中包含过时的入院情况(每人多次入院)。

我想要做的是,对于每次诊所就诊,我想将在该诊所就诊之前发生的住院人数相加,很简单。

这适用于 plyr 的 ddply,需要一些时间但效果很好。

现在,尝试在 dplyr 中重写,我得到一个错误

我有这样的编码:

显然 event_code 不在 temp2 数据框中。在“汇总”时,是否 dplyr 不能与“其他”数据帧一起使用?如果有更好的方法来进行“查找”/求和,我正在做我所有的耳朵。

我确实尝试了几次,尝试以不同的顺序在 vanilla R 上加载包,以尝试消除任何命名空间问题。

谢谢

编辑 - 可重现的例子

这是一个快速而肮脏的例子,只是为了说明这个问题。如果我们创建一个“查找”data.frame,每辆车有 2 个,mpg 约为 500,然后我们可以尝试遍历原始 data.frame,在新的 data.frame 中查找并将两个 mpg 相加. plyr 给出了预期的 1000 左右的数字。 dplyr 错误。

0 投票
4 回答
21746 浏览

r - 使用 dplyr 从数据帧中采样子组行

如果我想从不同组中随机选择一些样本,我使用 plyr 包和下面的代码

这里从每个物种中选择 10 个样本。

我的一些数据框非常大,我的问题是我可以使用与 dplyr 包相同的 sampleGroup 函数吗?还是在 dplyr 中有另一种方法可以做到这一点?

编辑

dplyr 包的 0.2 版引入了两个新函数,用于从表 sample_n 和 sample_frac 中选择随机行

0 投票
2 回答
41057 浏览

r - dplyr 可以总结几个变量而不列出每个变量吗?

dplyr 速度惊人,但我想知道我是否遗漏了什么:是否可以总结几个变量。例如:

有了这个小数据框,写起来很容易

而且我知道要得到我想要的,我可以融化,得到手段,然后 dcast 例如

但是,如果我有 >20 个变量和大量行怎么办。data.table 中是否有任何类似于 .SD 的内容,可以让我获取分组数据框中所有变量的平均值?或者,是否可以在分组数据帧上以某种方式使用 lapply ?

谢谢你的帮助

0 投票
8 回答
66247 浏览

r - dplyr 过滤器:获取变量最少的行,但如果有多个最小值,则仅获取第一行

我想使用 , 制作分组过滤器dplyr,在每个组中只返回具有变量最小值的行x

我的问题是:正如预期的那样,在多个最小值的情况下,将返回所有具有最小值的行。但就我而言,如果存在多个最小值,我只想要第一行。

这是一个例子:

正如预期的那样,所有最小值都返回:

使用 ddply,我会以这种方式完成任务:

...有效:

问:有没有办法在 dplyr 中解决这个问题?(出于速度原因)

0 投票
1 回答
7951 浏览

r - 总结 dplyr 中的值 - 崩溃 RStudio

可以对 adplyr执行链式summarise操作data.frame吗?

我的 data.frame 具有以下结构:

这会导致 RStudio 遇到一条fatal error - R Session Aborted消息

通常plyr我会summarise毫无问题地包含这些功能。

更新

数据在这里。

代码是:

0 投票
5 回答
18751 浏览

r - 指定 dplyr 列名

如果我不知道列名但想通过变量指定它,如何将列名传递给 dplyr?

例如这有效:

但这并不

0 投票
1 回答
9706 浏览

r - 具有 NULL 名称的对象上的 all.equal 会导致“错误:与 STRSXP 不兼容”——错误或预期?

在下面的示例中,当名称设置为 时NULLall.equal会抛出异常'Error: not compatible with STRSXP'
。但是,如果名称设置为NA(或其他值),all.equal则正常工作。
这是预期的行为还是错误?

0 投票
2 回答
1399 浏览

r - 使用 dplyr 对数据帧进行采样

我可以像这样从 data.frame 中采样 10 行:

使用 dplyr 执行此操作的语法是什么?这是我尝试过的:

0 投票
2 回答
2803 浏览

r - data.table 或 dplyr - 数据操作

我有以下数据

现在,我想计算Col1每个日期的唯一值(在前一个日期没有重复),并添加到前一个计数中。例如,