问题标签 [dplyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - dplyr 和可重用的参数列表
我玩过dplyr
一点,真的很喜欢。我错过了一些东西。在plyr
中,我能够将函数传递给ddply
并重用它。
因此,我可以将一长串录音应用到多个数据集,而无需将所有参数复制到summarise
. 但是dplyr
,我必须这样做
summarise
因此,每次都必须重复这些论点。带有list('.data'=DF1,'count'=length(id))
and的参数列表do.call
也不起作用,因为length(id)
在我定义参数列表时会对其进行评估。有什么解决方案吗?
r - 使用 dplyr 从不同的 data.frame 中提取数据?
我有一个名为 dat_new 的数据框,本质上它是诊所就诊数据,hrn 是患者 ID,dov 是就诊日期(每人多次就诊)。然后我有一个名为 event 的数据框,其中包含过时的入院情况(每人多次入院)。
我想要做的是,对于每次诊所就诊,我想将在该诊所就诊之前发生的住院人数相加,很简单。
这适用于 plyr 的 ddply,需要一些时间但效果很好。
现在,尝试在 dplyr 中重写,我得到一个错误
我有这样的编码:
显然 event_code 不在 temp2 数据框中。在“汇总”时,是否 dplyr 不能与“其他”数据帧一起使用?如果有更好的方法来进行“查找”/求和,我正在做我所有的耳朵。
我确实尝试了几次,尝试以不同的顺序在 vanilla R 上加载包,以尝试消除任何命名空间问题。
谢谢
编辑 - 可重现的例子
这是一个快速而肮脏的例子,只是为了说明这个问题。如果我们创建一个“查找”data.frame,每辆车有 2 个,mpg 约为 500,然后我们可以尝试遍历原始 data.frame,在新的 data.frame 中查找并将两个 mpg 相加. plyr 给出了预期的 1000 左右的数字。 dplyr 错误。
r - 使用 dplyr 从数据帧中采样子组行
如果我想从不同组中随机选择一些样本,我使用 plyr 包和下面的代码
这里从每个物种中选择 10 个样本。
我的一些数据框非常大,我的问题是我可以使用与 dplyr 包相同的 sampleGroup 函数吗?还是在 dplyr 中有另一种方法可以做到这一点?
编辑
dplyr 包的 0.2 版引入了两个新函数,用于从表 sample_n 和 sample_frac 中选择随机行
r - dplyr 可以总结几个变量而不列出每个变量吗?
dplyr 速度惊人,但我想知道我是否遗漏了什么:是否可以总结几个变量。例如:
有了这个小数据框,写起来很容易
而且我知道要得到我想要的,我可以融化,得到手段,然后 dcast 例如
但是,如果我有 >20 个变量和大量行怎么办。data.table 中是否有任何类似于 .SD 的内容,可以让我获取分组数据框中所有变量的平均值?或者,是否可以在分组数据帧上以某种方式使用 lapply ?
谢谢你的帮助
r - dplyr 过滤器:获取变量最少的行,但如果有多个最小值,则仅获取第一行
我想使用 , 制作分组过滤器dplyr
,在每个组中只返回具有变量最小值的行x
。
我的问题是:正如预期的那样,在多个最小值的情况下,将返回所有具有最小值的行。但就我而言,如果存在多个最小值,我只想要第一行。
这是一个例子:
正如预期的那样,所有最小值都返回:
使用 ddply,我会以这种方式完成任务:
...有效:
问:有没有办法在 dplyr 中解决这个问题?(出于速度原因)
r - 总结 dplyr 中的值 - 崩溃 RStudio
可以对 adplyr
执行链式summarise
操作data.frame
吗?
我的 data.frame 具有以下结构:
这会导致 RStudio 遇到一条fatal error - R Session Aborted
消息
通常plyr
我会summarise
毫无问题地包含这些功能。
更新
数据在这里。
代码是:
r - 指定 dplyr 列名
如果我不知道列名但想通过变量指定它,如何将列名传递给 dplyr?
例如这有效:
但这并不
r - 具有 NULL 名称的对象上的 all.equal 会导致“错误:与 STRSXP 不兼容”——错误或预期?
在下面的示例中,当名称设置为 时NULL
,all.equal
会抛出异常'Error: not compatible with STRSXP'
。但是,如果名称设置为NA
(或其他值),all.equal
则正常工作。
这是预期的行为还是错误?
r - 使用 dplyr 对数据帧进行采样
我可以像这样从 data.frame 中采样 10 行:
使用 dplyr 执行此操作的语法是什么?这是我尝试过的:
r - data.table 或 dplyr - 数据操作
我有以下数据
现在,我想计算Col1
每个日期的唯一值(在前一个日期没有重复),并添加到前一个计数中。例如,