问题标签 [group-summaries]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
16 浏览

crystal-reports - 来自 CR 中多个表的汇总计算

我正在处理水晶报告,并且对摘要有疑问 - 我有一批数据,其中包含三个级别的摘要:

这是我的查询:

基本上,该"customer"."veh_capex_2016"字段显示该运算符的单个值,例如 100 英镑,我需要在 "customer"."veh_capex_2016"和我的 VARIANCE 公式之间计算方差,{customer.veh_capex_2016}-{@Total Committed YTD}但将其插入摘要中会返回多个值。即{customer.veh_capex_2016}乘以订单数,然后减去{@Total Committed YTD}而不是仅返回单个字段值

非常感激地收到任何帮助或建议。

0 投票
1 回答
1052 浏览

r - 通过 R 中的多个不同列对数据框进行分组和汇总

我不知道我是否没有使用正确的术语进行搜索,但我找不到有关此的帖子。

我有一个 df :

我想按grouping_letter和 按分组grouping_animal。我想使用dplyr.

如果我单独做,那将是:

现在假设,我有数百个列需要单独分组。我怎样才能做到这一点?

我在尝试:

results <- NULL for (i in grouping_columns) { results[[i]] <- df %>% group_by(df$i) %>% summarize(sum(value)) }

我得到了一个名为 results 的列表和输出。我想知道是否有更好的方法来代替使用 for 循环?

0 投票
2 回答
2375 浏览

r - 用 dplyr “其他”组进行总结

我需要在分组的 data_frame 中进行总结(警告:非常感谢使用 dplyr 的解决方案,但不是强制性的)每个组(简单)和“其他”组上的相同内容。

最小的例子

我的预期结果如下

我搜索了类似于“dplyr 汇总排除组”、“dplyr 汇总其他组”的 Google 字符串,我搜索了 dplyr 文档,但找不到解决方案。

在这里,这个(如何使用 dplyr 总结与组不匹配的值)不适用,因为它仅在 sum 上运行,即是一个“特定于函数”的解决方案(并且具有一个简单的算术函数,它不考虑每个组的可变性)。更复杂的函数请求(即 mean、sd 或 user-function)呢?:-)

谢谢大家

PS:summarize()是一个例子,同样的问题导致mutate()或其他 dplyr-functions 基于组工作。

0 投票
2 回答
2932 浏览

r - R rbind rows to df with results calculated by group for multiple columns by name

How can I group by "id", apply some arithmetic functions to the last four columns (by group), and add new rows to the df containing the results. Here is an illustrative example with 5 samples (id) and 8 columns:

Reproducible example:

The result table should look something like the following. Rows 3, 6, 9, and 13 are the new rows containing the results. The new rows can be appended at the end of the table, or put in a tmp df to be added later with rbind (I can't figure out how to do it, either way). The grouping var is column "id". The function sum is used for "v1_gm". The function "mean" is used for multiple consecutive columns, here "v1_pct" and "v3_pct", that should be called by name (e.g., v1_pct:v3_pct). The value for "type" in the new rows is concatenated from "type" in the group rows, "d1" and "d2" are simply copied from the group row where treat=="A", and "treat" in the new row is assigned the value "cmb".

0 投票
2 回答
2072 浏览

r - 在 dplyr 中使用两个函数汇总数据

考虑到这个示例数据框:

我正在尝试使用“y”变量的两个操作获得一个汇总表。

第一个新列应该有每个代表的 trt 简单平均值:

第二个,每个代表的 trt 正值的比例。

我做了这么长时间,因为我不知道如何一步完成:

有人知道如何一步完成,同时加入这两个功能吗?

0 投票
1 回答
508 浏览

r - R - 来自变量的分组数据框

我想设置用于将数据框分组为变量的列,然后根据它对数据框进行分组和汇总,即

这样我就可以简单地更改var和使用第二行而不更改任何内容。不幸的是,我的解决方案不能像group_by询问列名而不是变量那样工作。

0 投票
0 回答
51 浏览

r - R:使用 dplyr 的条件嵌套分组摘要?

感谢@Frank 和我之前的帖子(那里有更多详细信息),我可以用它来回答一些关于人们在酒吧饮酒模式的数据集的问题:

具体来说,@Frank 建议使用以下代码:

这会生成分组摘要,说明顾客是否在每个酒吧点了相同的饮料,有多少,以及他们是否喜欢它们:

然而,对于这篇文章,我还有一个额外的问题,有些人的饮料订单是unspecified(in Quark's Bar),有些人点的是water

  1. 因为unspecified,我希望它充当“通用”饮料,因此它不会被视为不同的饮料(如果在该酒吧订购了其他饮料)。例如,在Quark's Bar我想要结果是TRUE每个人都点了相同的饮料。当然,如果在酒吧里每个人都只点菜unspecified,结果也会是TRUE

  2. 对于water,我通常希望它被忽略(例如,因为它不是酒精饮料!),所以起初我认为我可以简单地使用 dplyrfilter()删除订单所在的数据行water。复杂之处在于,我希望结果是TRUE人们唯一订购的东西water,例如 in Maz's Tavern。所以我不认为我可以简单地删除行water,我希望他们被考虑!换句话说,我不想water计算,除非它是唯一订购过的东西bar_name

有没有办法有条件地(这是正确的术语吗?)处理“特殊”项目,如wateror unspecified?我更喜欢基于 dplyr(即 Hadley-verse)的解决方案,该解决方案生成的表格类似于 @Frank 使用上面的代码所做的表格,其中考虑了这两个项目,尽管您能想到的任何内容都会受到赞赏。谢谢!

0 投票
2 回答
2567 浏览

r - 如何总结R中的行和列?

我有这种表:

我使用anti_join(对于具有非数值的表)和table命令以更好的方式对结果进行分组(类似于 Excel 中的 countif)。

我想知道是否可以添加每行和每列的总和,以便结果中会出现如下内容:

0 投票
1 回答
96 浏览

r - 计算并绘制时间间隔均值

我想使用 dplyr 和 ggplot2 计算和绘制不同颜色动物随时间变化的数量。

我在随机日期对不同动物进行了观察,因此我首先想将这些观察结果分组到 4 天的括号中,然后计算每个 4 天括号的平均颜色。我为前几个创建了带有噱头结果的 Bracket.mean 列,只是为了展示我的想法。如果可能的话,我想在同一个数据框中添加这些方法(而不是创建一个新的 data.frame 或向量)以供以后分析和绘图。

对于该图,我希望显示括号均值及其周围的一些方差度量(SD 或箱线图)以及随时间推移的日常观察结果(可能是背景中观察结果的褪色叠加)。

下面是我正在使用的数据集的一部分(我希望计算一个组成的“Bracket.mean”列)。“计数”是特定“颜色”的给定“日期”上的动物数量。

任何帮助将不胜感激。首先十分感谢!

0 投票
3 回答
1440 浏览

r - 在 R 中,在 dplyr 中使用 group_by() 和 summarise() 的意外结果

我不太明白如何使用 dplyr 包在 R 中构建一些分组和摘要。

通过下面的可重现示例,我尝试首先按 (PN,GOT,HID) 分组以计算 PC1 的不同实例。然后,我根据第二个分组,按 (PN,GOT) 重新分组,对 PC1 的不同实例求和。这个过程似乎适用于总和,除了对于平均值(TC),当我希望通过(PN,GOT)的分组看到平均值时,我得到了整个数据帧的平均值。我缺少什么来获得(PN,GOT)的那些手段,同时又不失去我建立的 PC1 的总和?我会很感激我在这里出错的地方的一些解释。

我认为我正在寻找的答案是这样的:

或者至少是这样的: