问题标签 [group-summaries]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sqlite - 在Sqlite中添加基于类别的汇总行
是否可以使用 group by 在行中添加摘要:具体来说,我正在寻找以下输出。
主表
输出应如下所示:
这里第一个总数是客户 a 的计费总和,类似地,接下来的 2 个总数分别是客户 b 和 c 的总和。
我可以使用以下代码实现类似的要求:select cast(Client as varchar(10)) Client, Billing from mydata union all select 'Total', sum(Billing) from mydata group by Client
但是总行数在最后,如下所示:(
r - 按周 dplyr 的条件和分组摘要
使前面的问题复杂化,假设我有以下袜子数据。
我如何使用summarise
indplyr
创建一个新变量
growth
,如果它们在第一年和第二年之间每周增加,则等于1
- else 0
。数据应如下所示
此外,如果抽屉在某一年中没有相应的一周,您将如何处理数据。akaNA
如果缺少一周,则添加。
r - 按组插入新观察值,它是 r 中的总和(或加权总和)
我还是 R 新手,很多事情仍然难以执行。这里的社区非常有帮助!我还有另一个问题。1. 为每个组创建一个新的观察值,它将是某些变量的总和(或加权总和) 2. 为一个有时包含 NA 的变量创建一个加权总和
我的数据集:
我想 1.为每个唯一 ID 创建一个新的观察,即 ID 1、ID 2、ID 3 和 ID 4
2. 这些新的观察结果如下: ID ID_name 体积分数(加权平均) 1 AA 30(即 10+20) (10*0.1+0.3*20)/(10+20) = 0.23 2 BB 80 (30 +50) (30*0.5)/30=0.5 (NA 行在分数计算中被忽略) 3 CC 90 (50+40) (60*0.6)/60=0.6 (NA 行在分数计算中被忽略) 4 DD 60 (20+30+10) (20*0.6+30*0.2+10*0.6)/60=0.4
我尝试了 mutate 函数,但这似乎不起作用。任何线索将不胜感激。谢谢
r - 对 summarise_at 中使用的函数应用舍入
我想计算多个变量的多个汇总统计数据,并将输出值四舍五入为 2 位。
这是一个简化的数据集
我还创建了一个我想要计算摘要统计的变量列表。
然后我用这段代码来计算平均值和标准差
我现在想将输出四舍五入为 2 位,但不知道如何将其合并到我的代码中。请帮忙 - 谢谢!
r - 按多列聚合并从长到宽重塑
SO上有一些与此主题类似的问题,但与我的用例不完全相同。我有一个数据集,其中列的布局如下所示
我想要做的是通过 Id、Description 捕获 Value 列的平均值。最终的数据集将如下所示。
我可以以非常粗略的方式做到这一点,但效率不是很高
这不是很方便。非常感谢任何有关如何更有效地实现预期结果的建议。
r - 如何在组值中找到大于r中某个值的最小值
我有以下数据框:
现在我想查找最小值大于 48 的所有 PATIENT_ID。在此示例中,患者 1、2、3 的最小值分别为 8、40 和 2。因此,它应该只返回 PATIENT_ID = 2,因为这是唯一一个最小值大于 48 的 PATIENT_ID。
r - 如何通过组测量的平均值在 df 中排列组?
基于 Kara Woo 的https://stackoverflow.com/a/26555424/9350837答案,我希望通过各个组汇总度量的平均值对我的分组 df 进行排序vizCredPrcnt
。
这是我的代码,到目前为止,
这是我得到的错误,
安排_impl(.data,dots)中的错误:位置3的大小(1)不正确,预期:144
这是我的 tibble,以及我希望排序的分组的视觉效果,
分组的小标题来安排
很高兴听到你的想法!
python - 如何在 Python 中对数据框进行分组并汇总连续数字的子组?
我有一个数据框,其中有一列包含 ids 和其他包含数字的列:
您可能会注意到,每个 ID 在“编号”列中都有相应的连续数字系列。例如:
Id 400 包含一系列长度为 4 {1, 2, 3, 4} 和另一个长度为 2 {8, 9}
我想为每个 ID 获得相应系列的平均长度。在这个例子中:
任何想法将不胜感激!
r - R - 分组后,如何获得重复值的最大次数?
假设我有一个这样的数据集:
IE,
对于每个 id,我将如何获得 foo 值的最大重复次数
IE,
例如,id 2 的 max_repeat 为 3,因为它的 foo (b) 值之一重复了 3 次。
r - 通过分组汇总数据时出现“无法创建对不可调用对象的调用”错误
我有以下数据框:
我想按 NR_HH 对这些数据进行分组,并构建一个新的数据框,显示每个家庭中成年女性、成年男性、学龄儿童和学龄前儿童的数量。我想得到这样的东西:
我尝试了以下代码:
但我得到这个错误: