问题标签 [group-summaries]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1994 浏览

r - 在 dplyr summarise() 中按组计算上下置信区间

我正在尝试制作一个表格,显示N(观察次数)、百分比频率(答案 > 0)以及百分比频率的上下置信区间,我想按类型对其进行分组。

数据示例

预期输出(填写值):

试图

这可以得到 N 和百分比频率,但返回一个错误:“列必须是长度 1(汇总值),而不是 3”,当我在 mean_ci 中添加时

我尝试的第二个代码,在这里找到:

这给了我一个输出,但置信区间不合逻辑。

0 投票
4 回答
297 浏览

python - 使用日期作为列值重塑数据

我正在尝试使用 pandas 重塑数据,并且很难将其转换为正确的格式。大致上,数据如下所示*:

我想重塑数据,使其看起来像这样:

我该怎么做呢?有没有更好的格式来重塑它?

最终我想对数据做一些分组总结,比如每个步骤发生的次数,例如

谢谢

  • 数据实际上包含许多用于制造管道不同阶段的日期开始/停止列
0 投票
2 回答
31 浏览

r - 按纬度汇总包含数字和字符串的数据框

我希望能够按位置(纬度)计算以下数据集的平均“IntakeEnergy”。我认为我遇到的问题是数据集同时包含数字和字符,这导致函数不知道如何计算字符串的平均值。我尝试按纬度对数据进行分组,然后使用以下方法计算其他列的平均值:

但是,这只有在我删除所有字符串列时才会成功。我对 excel 更加熟悉,我相信一个潜在的解决方案是创建一个数据透视表,但我不确定这是否是解决这个问题的最佳方法。

0 投票
1 回答
643 浏览

r - 在 dplyr 中使用跨函数

我有一个包含缺失值的数据框。

我的函数对因子进行分组,然后计算不包含 NA 值的行。

我得到了想要的结果。但是有一个警告信息。

我正在尝试更新代码库,以便停止警告消息。

注意:警告信息还说;

因此,如果没有警告消息,请重新启动 Rstudio 并重新运行脚本以生成警告消息。

0 投票
1 回答
160 浏览

r - 一次将 dplyr 函数应用于所有变量

我有一个带有数字变量(“数字”)和几个因子变量(因子 0 和 1(FALSE,TRUE)或 0 到 4(病理状态))的数据框。我想总结每个组(0 到 1、0 到 4)的“数字”的中位数和 IQR。

有没有办法将此函数应用于数据集中的每个因子列,而不必逐个键入一个变量?

输出:

0 投票
2 回答
249 浏览

r - 使用 tidyverse 对 R 中的多列进行加权和

我正在尝试生成每个因子水平的加权和。我有四列数据:

  • 如果仅填充第 2 列,则该值获取第 1 列的全部量。
  • 如果第 2 列和第 3 列被填充,则第 1 列中的值被分成两半。
  • 如果填充了第 2、3 和 4 列,则第 1 列中的值将分成三部分。
  • 如果第 2 列和第 4 列被填充,则第 1 列中的值除以 75/25。

因此,对于上面的示例输出,我的新数据框将是:

我摆弄了一下ifelse并提出了类似的东西(对于这个例子的两列):

现在我隔离感兴趣的列:

也对共显列执行此操作,绑定两个新数据帧的行并再次执行汇总功能。

这完成了工作,但也需要大约 50 行代码,在我看来,这不是很干净。

我的问题:有没有更好的(tidyverse)方法来做这种加权总结?

0 投票
1 回答
75 浏览

r - 多列汇总

在下面的数据集上需要汇总和分组功能的帮助

目标是针对标题为“名称”的列获取所有非空白的总和

下面使用 dput 的数据样本

我试过的代码

汇总输出(总和)与实际数字不匹配,公式无法生成给定条件的实际行总和

我想要的输出的粗略示例如下所示,只有两列(nps 计数和努力计数)(鉴于数据分布,总共 59 列)

姓名 nps 计数 努力计数
CICS_TEL_6_PP2020 年 2 月 xxx xxx
J_FTC_RTL_PPUpdated JanFeb2020 xxx xxx

PS:OP有错别字,见谅!

帮助赞赏的家伙

0 投票
1 回答
39 浏览

r - 如何结合 summarise_at 和需要从 R 中的多个列输入的自定义函数?

我有一份员工实际能力(每个月都在变化)和他们的计划能力(每个月都是不变的)的列表。我想使用 summarise_at 来告诉他们超过(或低于)分配的百分比。但是,我不知道如何通过汇总调用来管理我的自定义函数。我尝试查看此答案,但我的功能不同,因为它需要来自多个列的输入。

这是一个示例数据集:

这就是我想要的:

这就是我到目前为止所得到的。我知道自定义函数有效——我只是无法让它通过。X 将对应于它们的总分配(例如,对于分配 1 的 justin,1+2 = 3),并且 Y 是它们的计划分配(例如,3--不是 6)。因此,3/3 = 1 *100 = 100% 已分配。