问题标签 [rowsum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scala - Apache Spark中IndexedRowmatrix的行/列总和的有效方式
我在 Scala 中有一个 CoordinateMatrix 格式的矩阵。矩阵是稀疏的,整体看起来像(在 coo_matrix.entries.collect 上),
这只是一个很小的样本量。矩阵的大小为 N x N(其中 N = 100 万),尽管其中大部分是稀疏的。在 Spark Scala 中获取该矩阵的行和的有效方法之一是什么?目标是创建一个由行总和组成的新 RDD,即大小为 N,其中第一个元素是 row1 的行总和,依此类推..
我总是可以将此坐标矩阵转换为 IndexedRowMatrix 并运行一个 for 循环来一次计算一次迭代的行和,但这不是最有效的方法。
任何想法都非常感谢。
r - R - 匹配名称的向量和
我需要对名称以特定字符串开头的表的列求和。
一个示例表可能是:
我得到了列的列表(在这个例子中我只写了 2 个,但实际情况有更多的 tan 20)。
我试过了
但我只得到一个数字,两个向量中元素的总和。
我需要的是以下结果:
r - r中嵌套表上的rowsum
我有一个复杂的数据框,一个最小的例子如下:
看起来像这样:
在某种程度上,每个后续列都是前一列的一种子集。我必须验证农村、城市和总级别的分区和区的总和。
例如:第 7 行和第 8 行之和等于第 5 行中的值。第 5 行是农村分区。随着我们扩展 df,我有许多农村街道。所有农村分区的总和在第 2 行的农村区中给出。
最小预期输出如下:
364 是上面最小示例中给出的 117 + 247 的总和,而 913 是最小示例中给出的行 614 + 299 的总和。
目前我可以将子集设置为特定值,但不知道如何根据这些复杂的选择求和。有人可以帮忙吗?
r - R中按行的加权百分比贡献
我有一个 2 列的矩阵。我使用以下公式逐行计算了每列对整体的百分比贡献:
这给出了以下结果:
但是,我需要为每一行添加权重,即第 1 行为 1,第 2 行为 3。请问如何计算加权百分比贡献?
r - rowSums - 数组引起的错误
由于错误消息,我变得疯狂。我完全使用了脚本,但使用了另一个矩阵,我无法再计算行和。
我收到了这个烦人的错误信息:
x 必须是至少为二维的数组
我想计算矩阵影响中第 15 列的行总和。
postgresql - 每行汇总列postgresql
我有这样的表:
例如,里面有这样的数据:
我需要为每个用户 ID 获取总和,其中有很多。postgres 中是否有任何可以快速完成的功能?
java - 行总和平均值:比较时元素似乎为零
我想找出行和平均值,但如果行中出现零,那么当行的平均值完成时,应该保留该特定列。让它更清楚。我有一个矩阵说
第一行的行和平均值应该是 16/4 而不是 16/5,因为我们留下了第 1 行第 5 列,因为它包含“0”值
我正在尝试以下代码。对于第一行,它的工作正常,但对于其余的每行 2-5 和每列 5,尽管它不是零,但它的值仍然存在。
我的代码是:
我收到的程序的输出是:
我希望输出为:
请指导我哪里做错了
r - 如何获取R中选定列的rowSums
我是 R 的新手,并寻求帮助来计算每一行的选定列的总和。我的简单数据框如下。
我想要新数据框中每一行的 V1 到 V3 列和 V4 到 V6 列的总和。
我做了类似下面的事情。
但是我的代码应该有问题。提前感谢您的帮助。
r - 来自 data.frame 的数值向量的部分总和
我正在使用重复测量的数据库,我需要按类别计算数字向量的总和并删除重复项。
Category Area
A 30
A 15
A 20
B 45
B 30
C 12
D 18
D 22
并转换为:
Category Area
A 65
B 75
C 12
D 40
我怎样才能在 R 中得到这个?
r - 选择在 R 中最小化标准的列子集
我有一个data.frame
看起来像这样的稀疏二进制文件
我需要找到在我调用rowSums
这些列时最小化获得的零数量的 3 列。
例子:
在这里,当我调用rowSums
前 3 列时,我得到 2 个零,而当我调用rowSums
列时,2:4
我只得到一个0
,因此首选第二种解决方案。
当然,我申请时不需要列彼此相邻rowSums
,所以我需要探索所有可能的组合(例如:我rowSums
也想考虑这种情况 ov V1+V5+V17
,...),如果有多个“最佳”解决方案,我只保留其中一个就可以了。
请注意,我的实际data.frame
是 220.000 行 x 200 列,因此我需要一种有效的方法来消耗时间/内存。