问题标签 [group-summaries]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

68 问题

0 投票

4 回答

642 浏览

sqlite - 在Sqlite中添加基于类别的汇总行

是否可以使用 group by 在行中添加摘要：具体来说，我正在寻找以下输出。

主表

输出应如下所示：

这里第一个总数是客户 a 的计费总和，类似地，接下来的 2 个总数分别是客户 b 和 c 的总和。

我可以使用以下代码实现类似的要求：select cast(Client as varchar(10)) Client, Billing from mydata union all select 'Total', sum(Billing) from mydata group by Client

但是总行数在最后，如下所示:(

sqlite aggregate-functions group-summaries

2017-03-01T09:21:44.460

0 投票

2 回答

645 浏览

r - 按周 dplyr 的条件和分组摘要

使前面的问题复杂化，假设我有以下袜子数据。

我如何使用summariseindplyr创建一个新变量 growth，如果它们在第一年和第二年之间每周增加，则等于1- else 0。数据应如下所示

此外，如果抽屉在某一年中没有相应的一周，您将如何处理数据。akaNA如果缺少一周，则添加。

r dplyr group-summaries

2017-07-30T00:18:37.360

0 投票

1 回答

46 浏览

r - 按组插入新观察值，它是 r 中的总和（或加权总和）

我还是 R 新手，很多事情仍然难以执行。这里的社区非常有帮助！我还有另一个问题。1. 为每个组创建一个新的观察值，它将是某些变量的总和（或加权总和） 2. 为一个有时包含 NA 的变量创建一个加权总和

我的数据集：

我想 1.为每个唯一 ID 创建一个新的观察，即 ID 1、ID 2、ID 3 和 ID 4

2. 这些新的观察结果如下： ID ID_name 体积分数（加权平均） 1 AA 30（即 10+20） (10*0.1+0.3*20)/(10+20) = 0.23 2 BB 80 (30 +50) (30*0.5)/30=0.5 (NA 行在分数计算中被忽略) 3 CC 90 (50+40) (60*0.6)/60=0.6 (NA 行在分数计算中被忽略) 4 DD 60 (20+30+10) (20*0.6+30*0.2+10*0.6)/60=0.4

我尝试了 mutate 函数，但这似乎不起作用。任何线索将不胜感激。谢谢

r group-summaries

2017-11-09T14:35:32.813

0 投票

0 回答

1515 浏览

r - 对 summarise_at 中使用的函数应用舍入

我想计算多个变量的多个汇总统计数据，并将输出值四舍五入为 2 位。

这是一个简化的数据集

我还创建了一个我想要计算摘要统计的变量列表。

然后我用这段代码来计算平均值和标准差

我现在想将输出四舍五入为 2 位，但不知道如何将其合并到我的代码中。请帮忙 - 谢谢！

r rounding group-summaries

2017-12-06T17:11:36.863

0 投票

4 回答

1470 浏览

r - 按多列聚合并从长到宽重塑

SO上有一些与此主题类似的问题，但与我的用例不完全相同。我有一个数据集，其中列的布局如下所示

我想要做的是通过 Id、Description 捕获 Value 列的平均值。最终的数据集将如下所示。

我可以以非常粗略的方式做到这一点，但效率不是很高

这不是很方便。非常感谢任何有关如何更有效地实现预期结果的建议。

r dplyr aggregate mean group-summaries

2017-12-22T20:54:42.347

0 投票

3 回答

531 浏览

r - 如何在组值中找到大于r中某个值的最小值

我有以下数据框：

现在我想查找最小值大于 48 的所有 PATIENT_ID。在此示例中，患者 1、2、3 的最小值分别为 8、40 和 2。因此，它应该只返回 PATIENT_ID = 2，因为这是唯一一个最小值大于 48 的 PATIENT_ID。

r grouping minimum group-summaries

2018-01-09T22:05:13.943

0 投票

2 回答

1254 浏览

r - 如何通过组测量的平均值在 df 中排列组？

基于 Kara Woo 的https://stackoverflow.com/a/26555424/9350837答案，我希望通过各个组汇总度量的平均值对我的分组 df 进行排序vizCredPrcnt。

这是我的代码，到目前为止，

这是我得到的错误，

安排_impl（.data，dots）中的错误：位置3的大小（1）不正确，预期：144

这是我的 tibble，以及我希望排序的分组的视觉效果，

分组的小标题来安排

很高兴听到你的想法！

r sorting dataframe dplyr group-summaries

2018-02-12T16:32:46.650

0 投票

2 回答

130 浏览

python - 如何在 Python 中对数据框进行分组并汇总连续数字的子组？

我有一个数据框，其中有一列包含 ids 和其他包含数字的列：

您可能会注意到，每个 ID 在“编号”列中都有相应的连续数字系列。例如：

Id 400 包含一系列长度为 4 {1, 2, 3, 4} 和另一个长度为 2 {8, 9}

我想为每个 ID 获得相应系列的平均长度。在这个例子中：

任何想法将不胜感激！

python pandas pandas-groupby group-summaries

2018-11-21T16:29:23.463

0 投票

3 回答

42 浏览

r - R - 分组后，如何获得重复值的最大次数？

假设我有一个这样的数据集：

IE，

对于每个 id，我将如何获得 foo 值的最大重复次数

IE，

例如，id 2 的 max_repeat 为 3，因为它的 foo (b) 值之一重复了 3 次。

r dplyr duplicates group-summaries

2018-12-04T16:37:10.990

0 投票

1 回答

2555 浏览

r - 通过分组汇总数据时出现“无法创建对不可调用对象的调用”错误

我有以下数据框：

我想按 NR_HH 对这些数据进行分组，并构建一个新的数据框，显示每个家庭中成年女性、成年男性、学龄儿童和学龄前儿童的数量。我想得到这样的东西：

我尝试了以下代码：

但我得到这个错误：

r group-summaries

2018-12-10T12:29:56.760

1 2 3 4 5 6 7 8 9 10