问题标签 [summarize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
454 浏览

r - 我如何对分类变量求和并按因子汇总

所以让我更具体一点......我有一个数据集

  1. 足球队-球员

  2. 巴萨-梅西

  3. 巴萨-梅西
  4. 巴萨-梅西
  5. 巴萨-哈维

  6. -RM-CR

  7. -RM-CR

  8. -RM - 佩佩

  9. -RM -HIQUAIN 等(只是一个例子,不是数据集)

作为列!!!

我想要这个问题的答案: “我如何根据他们使用的球员数量找到前 5 名球队” *球队可以多次使用球员,因此不可能找到因子水平 *所以如果巴萨使用了 15 名球员并且Rm 使用了 14,然后 BARCA 是第一个......

0 投票
2 回答
58 浏览

r - R 为每个 id 的每个类汇总总计

假设我有一个这样的数据集:

IE,

我试图弄清楚如何以一种方式总结数据,为每个 id 提供他们上过的课程的列表以及每节课的小时数。我希望这些在一个列表中,这样我就可以在每个 ID 中保留一行。所以,我希望它返回:

我能够弄清楚如何让它返回class.list。

这给了我:

但我不确定如何才能将每个课程的小时数相加(class.hours)。

谢谢你的帮助!

0 投票
1 回答
678 浏览

r - R在dyplyr函数中使用粘贴来构建本地函数

我试图在构建本地函数时在 dplyr 的汇总或重命名中使用粘贴来命名变量。我收到一个错误:意外的 '=' in: " mutate(some.text= x) %>% rename(paste('hp', x, sep= '')="

这是一个例子:

或者

我会很感激任何帮助,在此先感谢!

0 投票
0 回答
6487 浏览

r - sum() 按主题 dplyr 向下列

我正在尝试使用 dplyr 来汇总一些数据,但无法计算出如何对列的一部分中的值求和。通常我会使用tally(),但在这种情况下,我想将所有的1 和0 相加,所以tally() 是不合适的。

我的数据看起来像这样:

所以,我想创建一个数据集,显示每个主题有多少“年长”的孩子和有多少“年幼的”孩子。这应该看起来像这样:

这是我到目前为止使用的代码:

我也尝试过用 summarise() 代替 mutate(); 两者似乎都忽略了我的 group_by 命令,只是给了我数据的总数。

非常感谢!

0 投票
2 回答
670 浏览

r - R - dplyr 对因素组合的总结

如果我有一个包含 2 个因子(a 和 b)、2 个水平(1 和 2)和 1 个变量(x)的简单数据框,我如何获得 x 的中值:每个因子 a 水平的中值 x因子 b 的水平,以及 a*b 的每个组合?

我尝试了各种(许多)版本:

对于因子 a 的每个水平的中位数 x,结果应如下所示:

中位数
1 0.58811
2 0.53167

对于因子 b 的每个水平的中位数 x 就像这样:

b 中位数
1 0.60622
2 0.46096

对于 a 和 b 的每个组合的中位数 x 就像这样:

ab 中位数
1 1 0.66745
1 2 0.34656
2 1 0.50903
2 2 0.55990

提前感谢您的帮助。

0 投票
2 回答
536 浏览

r - 在 R 中汇总数据

我有一个数据集,其中包含各种产品的每周销售量。以下是数据的样子:

这是一个非常大的数据集,我想生成一个摘要输出,它为我提供了 ITEM 明智的总销售额和该项目所在的商店数量。我尝试了以下方法,但这不起作用,因为我得到了一个由于数据集中重复数周而重复的商店计数:

非常感谢任何帮助。谢谢

0 投票
2 回答
1696 浏览

r - 如何在一个命令中组合两个不同的 dplyr 摘要

我正在尝试创建一个分组摘要,报告每个组中的记录数,然后还显示一系列变量的平均值。

我只能将如何做到这一点作为两个单独的摘要,然后将它们合并在一起。这很好用,但我想知道是否有更优雅的方法来做到这一点?

我正在使用的数据是这样的数据框:

0 投票
2 回答
4520 浏览

r - 使用 R 中的每日数据汇总每周平均值

如何在数据中添加一列 price.wk.average 使得 price.wk.average 等于上周的平均价格,同时在数据中添加一列 price.mo.average 使其等于平均值上个月的价格?整个星期的 price.wk.average 都是相同的。

0 投票
1 回答
444 浏览

r - 汇总数据框 r 中的唯一行数

需要你最好的建议。试图在纽约绘制自行车路线图。

这就是一条路线的样子

我可以假设我只需要两列 - 用于起点和终点站名称。

我的问题 - 如何对 129,839 个独特的行进行分组和汇总,并了解每条路线的使用频率。我相信它与 dplyr - group_by() 和 summarise() 一起使用,但尝试了几个选项,但没有任何效果。:(

真诚的 Oleksiy

0 投票
1 回答
628 浏览

r - 总结单列的使用条件

样本数据:

我做了:

但对于“是”的值保持与“否”相同的值。我尝试使用“如果”条件,但没有奏效。

我想要做的是通过帮助来总结它的总和df.help == "No"和总和df.help == "Yes",以及它们各自的概率。

最终结果应如下所示:

使用 ddply 或其他方式解决此问题的适当方法是什么?

问候