问题标签 [summarize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 我如何对分类变量求和并按因子汇总
所以让我更具体一点......我有一个数据集
足球队-球员
巴萨-梅西
- 巴萨-梅西
- 巴萨-梅西
巴萨-哈维
-RM-CR
-RM-CR
-RM - 佩佩
-RM -HIQUAIN 等(只是一个例子,不是数据集)
作为列!!!
我想要这个问题的答案: “我如何根据他们使用的球员数量找到前 5 名球队” *球队可以多次使用球员,因此不可能找到因子水平 *所以如果巴萨使用了 15 名球员并且Rm 使用了 14,然后 BARCA 是第一个......
r - R 为每个 id 的每个类汇总总计
假设我有一个这样的数据集:
IE,
我试图弄清楚如何以一种方式总结数据,为每个 id 提供他们上过的课程的列表以及每节课的小时数。我希望这些在一个列表中,这样我就可以在每个 ID 中保留一行。所以,我希望它返回:
我能够弄清楚如何让它返回class.list。
这给了我:
但我不确定如何才能将每个课程的小时数相加(class.hours)。
谢谢你的帮助!
r - R在dyplyr函数中使用粘贴来构建本地函数
我试图在构建本地函数时在 dplyr 的汇总或重命名中使用粘贴来命名变量。我收到一个错误:意外的 '=' in: " mutate(some.text= x) %>% rename(paste('hp', x, sep= '')="
这是一个例子:
或者
我会很感激任何帮助,在此先感谢!
r - sum() 按主题 dplyr 向下列
我正在尝试使用 dplyr 来汇总一些数据,但无法计算出如何对列的一部分中的值求和。通常我会使用tally(),但在这种情况下,我想将所有的1 和0 相加,所以tally() 是不合适的。
我的数据看起来像这样:
所以,我想创建一个数据集,显示每个主题有多少“年长”的孩子和有多少“年幼的”孩子。这应该看起来像这样:
这是我到目前为止使用的代码:
我也尝试过用 summarise() 代替 mutate(); 两者似乎都忽略了我的 group_by 命令,只是给了我数据的总数。
非常感谢!
r - R - dplyr 对因素组合的总结
如果我有一个包含 2 个因子(a 和 b)、2 个水平(1 和 2)和 1 个变量(x)的简单数据框,我如何获得 x 的中值:每个因子 a 水平的中值 x因子 b 的水平,以及 a*b 的每个组合?
我尝试了各种(许多)版本:
对于因子 a 的每个水平的中位数 x,结果应如下所示:
中位数
1 0.58811
2 0.53167
对于因子 b 的每个水平的中位数 x 就像这样:
b 中位数
1 0.60622
2 0.46096
对于 a 和 b 的每个组合的中位数 x 就像这样:
ab 中位数
1 1 0.66745
1 2 0.34656
2 1 0.50903
2 2 0.55990
提前感谢您的帮助。
r - 在 R 中汇总数据
我有一个数据集,其中包含各种产品的每周销售量。以下是数据的样子:
这是一个非常大的数据集,我想生成一个摘要输出,它为我提供了 ITEM 明智的总销售额和该项目所在的商店数量。我尝试了以下方法,但这不起作用,因为我得到了一个由于数据集中重复数周而重复的商店计数:
非常感谢任何帮助。谢谢
r - 如何在一个命令中组合两个不同的 dplyr 摘要
我正在尝试创建一个分组摘要,报告每个组中的记录数,然后还显示一系列变量的平均值。
我只能将如何做到这一点作为两个单独的摘要,然后将它们合并在一起。这很好用,但我想知道是否有更优雅的方法来做到这一点?
我正在使用的数据是这样的数据框:
r - 使用 R 中的每日数据汇总每周平均值
如何在数据中添加一列 price.wk.average 使得 price.wk.average 等于上周的平均价格,同时在数据中添加一列 price.mo.average 使其等于平均值上个月的价格?整个星期的 price.wk.average 都是相同的。
r - 汇总数据框 r 中的唯一行数
需要你最好的建议。试图在纽约绘制自行车路线图。
这就是一条路线的样子
我可以假设我只需要两列 - 用于起点和终点站名称。
我的问题 - 如何对 129,839 个独特的行进行分组和汇总,并了解每条路线的使用频率。我相信它与 dplyr - group_by() 和 summarise() 一起使用,但尝试了几个选项,但没有任何效果。:(
真诚的 Oleksiy
r - 总结单列的使用条件
样本数据:
我做了:
但对于“是”的值保持与“否”相同的值。我尝试使用“如果”条件,但没有奏效。
我想要做的是通过帮助来总结它的总和df.help == "No"
和总和df.help == "Yes"
,以及它们各自的概率。
最终结果应如下所示:
使用 ddply 或其他方式解决此问题的适当方法是什么?
问候