问题标签 [rowsum]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
73 浏览

r - 当所有变量都丢失时,在 SparklyR 中创建一个指示变量

我正在尝试在 sparklyr 中使用 rowSum 来创建一个指标变量,其中所有变量都丢失了,但似乎 rowSum 在 sparklyr 中不起作用。

我必须在 is.na() 函数中写下所有变量的名称,如下所示,这是不可能的,因为我有 100 个变量。

无论如何要在 is.na() 函数中编写多个变量吗?

0 投票
1 回答
693 浏览

r - R 在不应该的时候返回 NaN

我想计算作为总收入的一部分的转移份额(转移+工资)。然而,R 返回 NaN,即使它在数学上不应该。

我的数据结构是一个数据框,看起来与此类似(我总共有 500.000 行和 50 列):

在此处输入图像描述

我目前的代码对于上面的示例数据框如下所示:

df$transfershare <- (rowSums(df[,c(2,4,6)])/rowSums(df[,c(2,4,6,3,5,7)]))*100

基于:

转会总额为转会2012-2014年之和,工资总额为2012-2014年转会之和。

问题是,在运行此代码之前,我的 df 有 0 个缺失值,但在运行后它突然有 3000。我读过如果某些东西除以 0,通常会发生 NaN,但在此数据中没有观察值应该除以 0放。因此,我在想,我可能在代码中做错了什么?

0 投票
2 回答
1672 浏览

r - dplyr 选定行的行总和

我有以下数据:

我想使用 rowsum 和 mutate 生成一个新行,它是“d”之和,另一行是“e”之和,因此数据如下所示:

我认为代码应该是这样的:

然而这并不完全奏效。有任何想法吗?

谢谢

0 投票
1 回答
318 浏览

r - 如果满足多个列条件,则 RowSums 列集

我希望 RowSums 列的总数(在这种情况下是受教育年限),但前提是值(受访者的年龄)大于某个数字(> = 16)。列数大于示例(年龄和教育程度最多为 13),因此我希望找到一种有效的方法来实现 RowSums,而不依赖于逐列求和并保持所提议数据框的结构原样因为我希望之后 cbind 更多列。

从此数据框获取的最佳方法是什么 [...]

[...] TotEdu 结果?

在此处输入图像描述

0 投票
1 回答
432 浏览

r - 总结每一列的特定行

我确信我的问题很容易解决,不幸的是我无法为自己想出一个简单的解决方案。我想为每一列总结数据集的某些行。

我的数据集如下所示:

现在我希望它从第-1行到第1行和从第-2行到第1行的每一列求和一次。

对于 -1 到 1,这应该如下所示:

使用 colSums 函数,我只添加每列中的所有行,这不是我想要做的。

0 投票
1 回答
331 浏览

r - 根据其他列中的值计算数据框中的值的总和

我在 R 中有一个数据框,其中的值对应于值估计及其误差范围(MoE)。

列名模式指示符字符(e = 估计,m = 误差范围)和匹配估计值和误差范围的ID组成。
因此,列名看起来像“XXXe1, XXXm1, XXXe2, XXXm2, ...”。

目标

我正在尝试创建一个函数(对于每一行)

  1. 计算估计值的总和。(这很简单。)

  2. 计算总误差。这是每个 MoE 的平方和的平方根。

  3. 条件:标记为 0 的估计的 MoE 只能添加一次。

例子:

  • 在第 20 行,聚合的 MoE 应该只有sqrt(123^2).
  • 在第 13 行,B01001e4 和 B01001e5 为 0,因此它们的 MoE 只计算一次。

到目前为止,我已经完成了以下操作来构建一个执行此操作的函数:

我缺少什么:一种在新数据框中写入选择相应估计中没有 0 值的列的 XXXmYY 值的结果的方法。如果估计中有一个或多个 0,那么我应该在计算中只包含一次 MoE 123。

实现这一目标的最干净的方法是什么?我看到我的斗争是同时处理几列,而 XXXeYY 列上的值决定了 XXXmYY 列的选择。

预期产出

数据

0 投票
2 回答
274 浏览

r - rowsum 基于 r 中的分组或条件

我想根据列名r

我有 50 多个专栏,并查看了各种解决方案,包括这个.

但是,这并不能真正回答我的问题。我有列名,例如: total_2012Q1, total_2012Q2, total_2012Q3, total_2012Q4,..., up tototal_2014Q4和其他字符变量。我想按年份添加行,所以最后,我会有三年的列:total_2012, total_2013, total_2014.

我不想sample[,2:5]并选择类似 ... 有没有一种方法可以在不手动查看列号的情况下对它们求和?此外,是一个选项,但如果还有字符变量,你如何只处理你想要总结的 int 变量?

简单的可重现示例(前):

可重现的示例(帖子):

感谢您的任何建议。

0 投票
1 回答
912 浏览

r - R - 如何用rowsum减去

我的数据框看起来像这样。

我需要从第一列中减去最后两列。为了计算我会使用的列,rowSums(summary[,1:3])但我不知道如何减去这些列。请注意,我不能像这样编写代码,因为我不知道列名。

0 投票
2 回答
44 浏览

python - 将行和列总计添加到数据透视表失败

我想显示行和列的总数。我正在使用 margin=True 但输出未显示如下代码和输出的总行数:

下面的示例数据可以让您轻松,除了它是一个很长的数据。您还可以在上面的 df 向量中提供的 url 中找到。DataFrame 由四个变量组成:日期、站点、接收和发送。

0 投票
1 回答
297 浏览

r - rowsum 中的“组”参数如何工作?

我明白是什么rowsum(),但我正试图让它为自己工作。我使用了 R 中提供的示例,其结构如下:

产生的值矩阵是什么xsum以及如何获得这些值。我认为正在发生的事情是,从中获得的值group将用于说明矩阵中有多少条目要在rowsum. 例如,假设组 = (2,4,3,1,5)。我认为这意味着按行排列的前两个条目将被选为xsum. 似乎这不是正在发生的事情。