问题标签 [hadoop-plugins]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

139 问题

0 投票

1 回答

155 浏览

hadoop - Hadoop 使用 C++ 管道：如何调用 Mapper.cleanup()

使用 C++ 管道 api(1.2.0)，如何在映射器的 map() 阶段之后在 Mapper.cleanup() 中调用？基本上对于每个块，我想在映射阶段将我的记录存储在内存中，然后再应用一些处理。

欢迎任何提示，谢谢，

2013-05-30T12:42:01.330

0 投票

1 回答

1402 浏览

hadoop - 我分别有 tesseract-ocr 和 hadoop。我需要整合它们

根据我的图像处理项目。我需要将hadoop（并行处理器）与tesseract（图像处理到txt）集成。

hadoop tesseract hadoop-streaming hadoop-plugins

2013-06-13T06:22:15.617

0 投票

1 回答

496 浏览

hadoop - 如何在 Hadoop 中添加新的调度程序？

我正在尝试在 Hadoop 中添加一个新的调度程序。它不是默认的（FairScheduler/CapacityScheduler）。我用svn检查了源代码。现在，我应该编辑哪个源文件/类来获得这个功能？

hadoop scheduler hadoop-plugins

2013-06-15T15:19:05.417

0 投票

3 回答

1164 浏览

hadoop - Ubuntu 上 Hadoop 的 Eclipse 插件错误

我成功安装了 Hadoop 版本 1.0.3 及其相关的 eclipse 插件。所有 Hadoop 功能和示例都运行良好，但是当我想在 eclipse 上使用它的插件时，它无法连接到 hdfs，我得到了错误：

在“连接到 DFS localhost”期间发生内部错误。org/apache/commons/配置/配置。

谁能帮我解决这个问题！谢谢

hadoop eclipse-plugin hadoop-plugins

2013-06-25T21:11:34.293

0 投票

1 回答

2850 浏览

hadoop - 性能：猪与蜂巢

我发现了 Pig 和 Hive 之间的一些（显着）性能差异（在实时运行时间和 CPU 时间方面），并且正在寻找解决这些差异的方法。我使用了两种语言的解释功能（即 Hive：EXPLAIN 关键字，Pig：pig -e 'explain -script explain.pig'）来对比和比较生成的语法树、逻辑、物理和 map-reduce 计划。然而，两者似乎都做同样的事情。然而，作业跟踪器显示启动的 map 和 reduce 任务的数量存在差异（因此我确保两者使用相同数量的 map 和 reduce 任务并且性能差异仍然存在）。因此，我的问题是：我可以通过哪些其他方式分析正在发生的事情（可能在较低级别/字节码级别）？

编辑：我正在运行 TPC 的 TPC-H 基准测试（可用https://issues.apache.org/jira/browse/PIG-2397和https://issues.apache.org/jira/browse/HIVE-600）。然而，更简单的脚本也显示出相当大的性能差异。例如：

我仍然需要全面评估 TPC-H 基准（稍后会更新），但更简单脚本的结果在本文档中有详细说明：https ://www.dropbox.com/s/16u3kx852nu6waw/output.pdf

（jpg：http: //i.imgur.com/1j1rCWS.jpg）

hadoop hive apache-pig hadoop-plugins

2013-07-02T09:28:43.467

0 投票

1 回答

2134 浏览

hadoop - 使用cygwin在windows中安装猪

我在 windows xp 中使用 cygwin 来安装 pig-0.11.1。我提取了我的 pig_home 文件夹并将其放置在 cygwin 的用户目录中。当我尝试在提示符 ./pig help 中命令时，它向我显示以下错误。

其中：（/usr/local/bin:/usr/bin:/cygdrive/c/Program Files/Java/jdk1.6.0_31/bin:/home/sunil/pig-0.11.1/bin）中没有hadoop cygpath：无法创建 C:\cygwin\home\sunil\pig-0.11.1\logs 的短名称找不到 pig.jar。做'ant jar'，然后再试一次

我能得到一些帮助吗？提前谢谢。

问候，约翰

hadoop cygwin apache-pig hadoop-plugins cygpath

2013-07-04T10:01:28.590

0 投票

1 回答

732 浏览