问题标签 [hadoop-plugins]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - 如何在 Hadoop 中访问和操作 pdf 文件的数据?
我想使用hadoop阅读PDF文件,怎么可能?我只知道hadoop只能处理txt文件,所以无论如何都要将PDF文件解析为txt。
给我一些建议。
mongodb - 带有 mongodb 插件的 hadoop - 读取数据
我知道可以通过 hadoop 从 mongodb 读取和写入数据。
我想知道这个适配器在从 mongodb 集合读取数据时是否使用 mongodb 的本机驱动程序,所以它使用 mongod 实例还是这个适配器直接读取数据集合?
另外,当hadoop读取mongodb的数据以在map reduce中进行处理时,hadoop的这个map reduce不会锁定mongodb的数据收集吗?
换句话说,当hadoop读取mongodb的数据时,hadoop保存这些数据以供hadoop使用,并且hadoop不会干扰mongodb数据,因为当hadoop执行mapreduce时,它会处理mongodb检索的数据,但将内部保存在hadoop进行处理?
mongodb - hadoop mongodb 连接器 - 输出数据不是 mongodb 而是 hdfs
是否可以从hadoop mongodb插件连接器读取mongodb数据,使用mapreduce hadoop处理数据,以及当输出结果不使用hadoop mongodb插件连接器但在hdfs中保留mapreduce hadoop的结果时?
hadoop - 如何将自定义 hadoop 本机编解码器编译为 libhadoop.so?
我写了一个原生 hadoop 压缩编解码器。为了让它与 hadoop 一起工作,我需要将本机(C 代码)编译为 libhadoop.so。
我怎样才能做到这一点?
hadoop - 是否可以使用几个 jar 来指定 hadoop 中的作业?
我通常在不同的 jar 文件中有公共/共享库和实际工作代码。是否可以只重新编译一个作业 jar 文件来执行 hadoop 命令hadoop jar asd
?如果没有,是否有简化 jar 包装的解决方法?
java - Hadoop 插件 Karmasphere - 文件的阻止列表已更改异常
我目前已经开始使用 karmasphere eclipse 插件来做 mapreduce 工作。我按照文档中的说明操作,可以在主机上运行本地开发、部署作业。后来我下载了Cloudera CDH3并作为VM运行(通过VMWare),我可以在VM(来宾机器)本地运行mapreduce作业,我可以从eclipse Hadoop的角度监控VM中发生的mapreduce作业(主机),当我尝试使用 karmasphere 远程部署时,我只能看到 HDFS 中的可用文件,但我无法访问这些文件,也无法运行 map reduce 程序,也无法从我的 eclipse IDE 在 HDFS 中创建新文件。我得到以下异常:
有人可以帮我解决这个问题吗?我是 karmasphere 和 Hadoop 的新手。
hadoop - 部分聚合与组合器哪个更快?
有关于级联/烫伤如何优化地图侧评估的通知 他们使用所谓的部分聚合。它实际上是比组合器更好的方法吗?一些常见的hadoop任务(例如字数)是否有任何性能比较?如果是这样,hadoop 将来会支持这个吗?
eclipse - Eclipse MapReduce 插件错误:服务器 IPC 版本 7 无法与客户端版本 3 通信
当我尝试从我的笔记本电脑(我有我的 eclipse 和 mapreduce 插件)连接到 MapReduce 位置时,该位置是一个名称节点和数据节点的集群,我收到错误:服务器 IPC 版本 7 无法与客户端版本 3 通信。我试图找到谷歌上的一些信息,但找不到太多。是不是因为我的mapreduce eclipse插件使用的是旧版本的IPC,而hadoop集群有更新的插件。所以只是我使用过时的插件?如何找到我的 eclipse 插件使用的 IPC 版本?有任何想法吗?
hadoop - hadoop eclipse插件安装目录
我是hadoop和eclipse的新手。尝试添加新的hadoop服务器时,谁能告诉我hadoop eclipse插件的安装目录格式。我用谷歌搜索并尝试了几个小时,但没有绝望......任何帮助将不胜感激
hadoop - HBase 按值排序
我正在使用 SingleColumnValueFilter、scan、getScanner 并从 hbase 表中检索值。结果值在 Id-vise 行中排序。但我希望结果在价值虎钳中进行排序。
例子:
现在,当我在 Web UI(我自定义)中选择金额时。然后,Result 应该按数量进行排序。