问题标签 [rowsum]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2246 浏览

scala - Apache Spark中IndexedRowmatrix的行/列总和的有效方式

我在 Scala 中有一个 CoordinateMatrix 格式的矩阵。矩阵是稀疏的,整体看起来像(在 coo_matrix.entries.collect 上),

这只是一个很小的样本量。矩阵的大小为 N x N(其中 N = 100 万),尽管其中大部分是稀疏的。在 Spark Scala 中获取该矩阵的行和的有效方法之一是什么?目标是创建一个由行总和组成的新 RDD,即大小为 N,其中第一个元素是 row1 的行总和,依此类推..

我总是可以将此坐标矩阵转换为 IndexedRowMatrix 并运行一个 for 循环来一次计算一次迭代的行和,但这不是最有效的方法。

任何想法都非常感谢。

0 投票
1 回答
816 浏览

r - R - 匹配名称的向量和

我需要对名称以特定字符串开头的表的列求和。

一个示例表可能是:

我得到了列的列表(在这个例子中我只写了 2 个,但实际情况有更多的 tan 20)。

我试过了

但我只得到一个数字,两个向量中元素的总和。

我需要的是以下结果:

0 投票
1 回答
84 浏览

r - r中嵌套表上的rowsum

我有一个复杂的数据框,一个最小的例子如下:

看起来像这样:

在某种程度上,每个后续列都是前一列的一种子集。我必须验证农村、城市和总级别的分区和区的总和。

例如:第 7 行和第 8 行之和等于第 5 行中的值。第 5 行是农村分区。随着我们扩展 df,我有许多农村街道。所有农村分区的总和在第 2 行的农村区中给出。

最小预期输出如下:

364 是上面最小示例中给出的 117 + 247 的总和,而 913 是最小示例中给出的行 614 + 299 的总和。

目前我可以将子集设置为特定值,但不知道如何根据这些复杂的选择求和。有人可以帮忙吗?

0 投票
0 回答
166 浏览

r - R中按行的加权百分比贡献

我有一个 2 列的矩阵。我使用以下公式逐行计算了每列对整体的百分比贡献:

这给出了以下结果:

但是,我需要为每一行添加权重,即第 1 行为 1,第 2 行为 3。请问如何计算加权百分比贡献?

0 投票
3 回答
4264 浏览

r - rowSums - 数组引起的错误

由于错误消息,我变得疯狂。我完全使用了脚本,但使用了另一个矩阵,我无法再计算行和。

我收到了这个烦人的错误信息:

x 必须是至少为二维的数组

我想计算矩阵影响中第 15 列的行总和。

0 投票
1 回答
3209 浏览

postgresql - 每行汇总列postgresql

我有这样的表:

例如,里面有这样的数据:

我需要为每个用户 ID 获取总和,其中有很多。postgres 中是否有任何可以快速完成的功能?

0 投票
3 回答
53 浏览

java - 行总和平均值:比较时元素似乎为零

我想找出行和平均值,但如果行中出现零,那么当行的平均值完成时,应该保留该特定列。让它更清楚。我有一个矩阵说

第一行的行和平均值应该是 16/4 而不是 16/5,因为我们留下了第 1 行第 5 列,因为它包含“0”值

我正在尝试以下代码。对于第一行,它的工作正常,但对于其余的每行 2-5 和每列 5,尽管它不是零,但它的值仍然存在。

我的代码是:

我收到的程序的输出是:

我希望输出为:

请指导我哪里做错了

0 投票
7 回答
32002 浏览

r - 如何获取R中选定列的rowSums

我是 R 的新手,并寻求帮助来计算每一行的选定列的总和。我的简单数据框如下。

我想要新数据框中每一行的 V1 到 V3 列和 V4 到 V6 列的总和。

我做了类似下面的事情。

但是我的代码应该有问题。提前感谢您的帮助。

0 投票
1 回答
485 浏览

r - 来自 data.frame 的数值向量的部分总和

我正在使用重复测量的数据库,我需要按类别计算数字向量的总和并删除重复项。

Category Area
A 30
A 15
A 20
B 45
B 30
C 12
D 18
D 22

并转换为:

Category Area
A 65
B 75
C 12
D 40

我怎样才能在 R 中得到这个?

0 投票
1 回答
115 浏览

r - 选择在 R 中最小化标准的列子集

我有一个data.frame看起来像这样的稀疏二进制文件

我需要找到在我调用rowSums这些列时最小化获得的零数量的 3 列。

例子:

在这里,当我调用rowSums前 3 列时,我得到 2 个零,而当我调用rowSums列时,2:4我只得到一个0,因此首选第二种解决方案。

当然,我申请时不需要列彼此相邻rowSums,所以我需要探索所有可能的组合(例如:我rowSums也想考虑这种情况 ov V1+V5+V17,...),如果有多个“最佳”解决方案,我只保留其中一个就可以了。

请注意,我的实际data.frame是 220.000 行 x 200 列,因此我需要一种有效的方法来消耗时间/内存。