问题标签 [summarize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
6393 浏览

r - R中的聚合以按组计算总数的百分比?

我已经尝试过这段代码。我得到了总和计数的分组,但不是百分比?

0 投票
4 回答
512 浏览

r - 根据条件为每个 ID 提取多行

我有一个包含数千行的数据框,但下面给出了一个示例:

输入(数据)

我正在做的是提取所有包含事件下“订单”一词的用户标识行。结果将包含 userid 的所有行,不包括 userid = 333,因为 eventaction 不包含订单条目。

第二个任务是在输入订单之前计算“查看”的出现次数。我将不胜感激帮助和指点。

谢谢。

0 投票
2 回答
119 浏览

r - dplyr:如何处理多个值

我有一个数据框,它在同一分钟内返回 2 个组。如何处理以达到我的预期输出?

我试过下面的代码

我越来越:

错误:期望单个值

我想要像下面这样的输出。

0 投票
1 回答
324 浏览

r - 一步完成分组、汇总和转置

我有一个看起来像这样的数据框

我希望能够将其转换如下:

所以基本上我想 - 按 2 个字段(车辆、模型)分组,然后按月份计算“销售”列中的记录数,然后转置数据,使月份成为列,车辆/模型我的行。此外,某些模型可能没有长达 12 个月,但我想显示所有列 1 到 12,如果没有可用数据则保留 0

数据框非常大。有什么推荐吗?谢谢

0 投票
2 回答
322 浏览

python - python pandas总结名义变量(计数)

我有以下数据框:

我有兴趣按 PROD 和 PARAMETER 列汇总 Y/N 列值并获得以下输出:

而 Y 和 N 值是来自原始数据帧的 Y/N 列值的计数。

0 投票
0 回答
47 浏览

dax - 求和和关联表 DAX

我确实有一个包含成本和项目编号、行号和项目编号的表 (1),并且希望在另一个表 (2) 中的新列中汇总成本,其中我也有项目编号和项目行。第二个表没有项目编号,但也包含更多汇总级别的预算数字。这两个表在 Keyz 上链接。

表格1

表2

我在表2中完成了以下公式

我在 table2 的新列中没有得到任何价值。

希望有人能够帮助我。table1 中的 Pjnumb 和 PjLine 是从第三个表中检索的,此处未显示。

克里扬

0 投票
0 回答
150 浏览

r - 如何在 r 中使用 dplyr 按父组求和来总结子组

我生成的数据如下:

以下代码的完整 数据集例如:“A”组中的 2 个详细信息“P”实例,以及一个名为 Time 的变量的总和(未显示,P1 的时间 = 0.75,P2 的时间 = 0.50) Value 为 1.25,Count_Avg 的平均值为 0.63。组“B”中有 18 个细节“G”实例,Value 的总和为 33.5,Count_Avg 的平均值为 1.86,依此类推。

这是我用来生成上表的代码。

我想添加另一列,即每个Detail的Group百分比。举个例子:

“A”组中所有细节的总值 = 1.25 + 0.5 + 0.25 = 2.0,“A”组中细节“P”的百分比 = 1.25/2.0 = 0.625。结果表如下所示:

谢谢你的帮助。

0 投票
1 回答
147 浏览

r - 应用于summary + group_by 的函数无法正常工作

我提取我的数据

我在三列中显示:基于原始日期的日、月和年:Y - m - d

这是我的 data_frame 的一部分:

数据框

然后,我做了汇总和 group_by 以应用该功能:

=> 我想要每个月、每年测量的最大荧光深度。

但它不起作用...... prof_DCM 的值在 data_frame 的第 3 列中仍然相同:

第 3 列的相同值

0 投票
2 回答
86 浏览

r - 在 R 中合并数据框的优雅方法?

我想获取数据框的唯一行,然后将其与另一行属性连接。然后我希望能够计算出品种的数量,例如特定类型或来源的独特水果的数量。

第一个数据框有我的水果清单:

第二个数据框有我的属性:

这是我对这个问题的笨拙解决方案:

所以我的主要问题是:如何更优雅地表达这一点(即单行而不是 3 行)?其次:为什么它不允许我重命名列?

提前致谢

0 投票
1 回答
26 浏览

r - 通过数字变量将函数应用于多个变量

我的数据如下:

这只是前 10 行。整个数据集有许多不同的 Week_ID 和 ZCTA。

我想做的是通过 ZCTA 和 Week_ID 取“T_mean_F”和“降水”的平均值以及“单位”的总和,最好是一次调用。最终结果看起来像这样(只是一个例子,不是实际输出):

这是我尝试过的:

这两个都是我以前关于这个主题的问题的模型,并且都产生了错误。

任何人都知道一个平滑/优雅的方式来完成这个?

谢谢,-基思