问题标签 [combiners]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
170 浏览

swift - 合并所有子类中的属性以输入 SWIFT 的父类?

我希望将所有子类 variableOne 添加到父类属性一

我还希望将所有子类 variableTwo 添加到父类 2

0 投票
4 回答
99 浏览

php - PHP,使用所有其他数组值

我必须用其他数组值制作一个复杂的数组。

原始数组是:

我正在寻找一个函数,它可以为我提供所有可能的组合值,如下所示:

当然,即使原始数组中值的数量不同,该算法也必须有效。

我正在 PHP 文档中寻找一个简单的函数来执行此操作,但我没有找到。

我用“multiplex”或“combine”等关键字搜索了它,但没有运气。我认为最好的方法是制作一个递归函数,但我找不到正确的算法。

0 投票
0 回答
267 浏览

python - Hadoop 组合器不写入减速器

当我执行以下操作时,一切都在本地正常工作:

显示"Java.io.IOException: Bad file descriptor" and "WARN org.apache.hadoop.streaming.PipeMapRed: java.io.IOException: Broken pipe"

这只发生在我使用组合器运行时,而不是当我使用映射器和减速器运行时。

映射器:

合路器:

减速器:

问题类似于“倒排索引” - 最终输出将是 < word , [list of docs],count>

任何帮助都会很好。

0 投票
1 回答
6847 浏览

hadoop - mapreduce中组合器和映射器内组合器之间的区别?

我是 hadoop 和 mapreduce 的新手。有人可以澄清组合器和映射器内组合器之间的区别还是它们是同一回事?

0 投票
4 回答
7604 浏览

r - 如何在 R 中合并同一数据框中的行(基于特定列下的重复值)?

df 中 2 个(虚构)示例行的示例:

假设我有几百个重复的用户 ID,就像上面的例子一样。但是,绝大多数 userid 具有不同的值。

除非第一个值为 NA (在这种情况下,NA 将重新填充来自第二个的任何值)排)?

本质上,从上面的示例中得出,我的理想输出将包含:

0 投票
1 回答
83 浏览

java - 比较成对的数据,有时只结合

我正在使用 Spark。我有一个JavaPairRDD表格<Documentname, Tuple2<Phrase, URL>>

我基本上已经检查了一个短语是否在 URL 指定的页面中,从而产生了上面的结构。

现在,我有几个重叠的短语(即“to be or”在“to be or not to be”中),我想删除这些包含在较大短语中的较短短语。

我对 Spark 有点陌生,所以我不确定如何在 Spark中执行此操作。

我知道如果我收集()元素,我可以创建一个双嵌套循环并执行此操作,但我想知道是否有办法在 Spark 中通过减少或聚合来执行此操作。

基本上,我想要一个函数来检查每对短语,如果一个短语不包含在另一个短语中,则返回两个短语,或者如果一个短语包含在一个短语中,则返回一个短语。

或者,我想运行某种过滤器来删除这些较短的短语。

有任何想法吗?

编辑:我认为 CombinebyKey 或 AggregateByKey 都可以,但我不知道如何在 Java 中使用它们。什么是序列/组合器功能?

我想按键组合 > 的几个元素,并有一个元组列表,其中一个短语不包含在其他任何短语中。

0 投票
1 回答
237 浏览

php - 组合多维数组的值

我有这样的多维数组输出如下所示

我想组合pid和使用任何分隔符的值,map但不是相同的comma(,)id

这是一个样本数据数组有超过 20000 个值,深度级别未知可能是 18 或 20

预期输出为。在这里我:用作分隔符

我尝试了很多代码

其中一个功能是array_merge_recursive

我也试过这个解决方案检查这个

提前谢谢让我知道是否有任何功能

0 投票
3 回答
1634 浏览

c# - 一种将多个ogg文件合并为一个的方法

谁能给我一个示例代码或指出如何使用 C# 将多个 ogg 文件合并为一个的正确方向?

0 投票
1 回答
536 浏览

hadoop - 在 reducer 上执行 Hadoop 组合器

我有一个长期运行的 MapReduce 工作,其中一些映射器比其他映射器花费更多的时间。

检查 Web 界面上的统计信息,我看到我的组合器也启动了减速器(其中大部分空闲,因为只有 2 个映射器仍在运行)。

尽管在所有映射器完成之前不浪费时间并进行一些预聚合似乎是合理的,但我找不到任何有关此行为的文档。谁能确认这确实是 Hadoop 的一个功能,或者只是在 Web 界面上显示错误?

0 投票
1 回答
3737 浏览

scala - 将键/值对列表转换为 spark 中每个键的值列表

我们需要有效地转换大量键/值对列表,如下所示:

进入每个键的值列表,如下所示:

键值对来自大型键/值存储(Accumulo),因此键将被排序,但通常会跨越 Spark 分区边界。每个键可以有数百万个键和数百个值。

我认为这项工作的正确工具是 spark 的 combineByKey 操作,但只能找到具有泛型类型(如 Int)的简洁示例,我无法将其推广到上述用户定义的类型。

由于我怀疑许多其他人会有同样的问题,我希望有人可以提供完全指定(详细)和简洁的 scala 语法示例,以便将 combineByKey 与上述用户定义类型一起使用,或者可能指出一个更好的工具我错过了。