问题标签 [hadoop2]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2060 问题

0 投票

1 回答

255 浏览

hadoop - 如何保证 MapReduce 任务相互独立？

我很好奇，但 MapReduce、Hadoop 等如何将一大块数据分解为独立操作的任务？我很难想象这是怎么回事，考虑到数据通常是相互关联的，任务之间的状态条件等等。

hadoop parallel-processing mapreduce batch-processing hadoop2

2010-03-01T16:53:42.763

0 投票

2 回答

1230 浏览

hadoop - Hadoop：在 Apache Mahout 中实现贝叶斯算法时出错

我在 Mahout 中执行贝叶斯算法时遇到问题。我用 Maven 构建了它，作业文件在目标目录中。当使用 Hadoop 从终端运行时，我收到 ClassNotFoundException 错误。应该做什么？

线程“主”java.lang.ClassNotFoundException 中的异常：java.net.URLClassLoader$1.run(URLClassLoader.java:200) 处 java.security.AccessController 处的 org.apache.mahout.classifier.bayes.mapreduce.bayes.bayesdriver。 doPrivileged(Native Method) at java.net.URLClassLoader.findClass(URLClassLoader.java:188) at java.lang.ClassLoader.loadClass(ClassLoader.java:307) at java.lang.ClassLoader.loadClass(ClassLoader.java:252)在 java.lang.ClassLoader.loadClassInternal(ClassLoader.java:320) 在 java.lang.Class.forName0(Native Method) 在 java.lang.Class.forName(Class.java:247) 在 org.apache.hadoop.util .RunJar.main(RunJar.java:149)

hadoop hadoop2 mahout bayesian

2010-03-15T19:05:49.363

0 投票

3 回答

3017 浏览

hadoop - Hadoop伪分布式模式错误

我已经使用 Virtualbox 在 OpenSuse 11.2 VM 上设置了 Hadoop。我已经进行了先决条件配置。我在独立模式下成功运行了这个示例。但在伪分布式模式下，我收到以下错误：

hadoop hdfs hadoop2

2010-04-13T11:39:06.040

0 投票

2 回答

2110 浏览

hadoop - Hadoop：Reducer 正在生成错误

我继续进入Exceeded MAX_FAILED_UNIQUE_FETCHES减少阶段。

即使我尝试了所有可以在网上找到的解决方案。

节点：已安装服务

Master_Node：Namenode、JobTracker

配置文件附在下面：

核心站点.xml

mapred-site.xml

hadoop hadoop2 administration

2010-07-13T01:23:11.270

0 投票

3 回答

15784 浏览

hadoop - Hadoop namenode：单点故障

Hadoop 架构中的 Namenode 是单点故障。

拥有大型 Hadoop 集群的人如何应对这个问题？

是否有一个行业接受的、运行良好的解决方案，其中一个辅助 Namenode 接管以防主 Namenode 出现故障？

hadoop mapreduce hdfs hadoop-yarn hadoop2

2010-12-21T17:46:06.510

0 投票

2 回答

1119 浏览

hadoop - hadoop distcp 故障转移 hftp 协议

我想通过 hftp 协议使用 distcp 从 cdh3 和 cdh4 复制文件。命令如下： hadoop distcp hftp://cluster1:50070/folder1 hdfs://cluster2/folder2

但是由于http connection errorjobtracker UI中的一些原因，工作失败了

folder1 中的大多数文件将被复制到 folder2，但某些文件由于上述异常而失败。任何人都和我有同样的问题，以及如何解决这个问题？提前致谢。

hadoop connection hadoop2 distcp

2013-10-15T03:39:48.923

0 投票

3 回答

12507 浏览

hadoop - copyFromLocal: `/user/hduser/gutenberg': 没有这样的文件或目录

到目前为止，我一直遵循 michael-noll 的指南，但被困在这里。

我尝试使用“Y”重新格式化名称节点，但对于任意文件夹名称每次都得到相同的结果。

有任何想法吗？

hadoop hadoop2

2013-11-11T18:02:25.217

0 投票

23 回答

525284 浏览

java - Hadoop“无法为您的平台加载本机 hadoop 库”警告

我目前正在运行CentOs的服务器上配置 hadoop 。当我运行start-dfs.shorstop-dfs.sh时，我收到以下错误：

WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... 在适用的情况下使用内置 java 类

我正在运行Hadoop 2.2.0。

在线搜索出现了这个链接：http ://balanceandbreath.blogspot.ca/2013/01/utilnativecodeloader-unable-to-load.html

但是，/native/hadoop 2.x 上的目录内容似乎有所不同，所以我不确定该怎么做。

我还在以下位置添加了这两个环境变量hadoop-env.sh：

导出 HADOOP_OPTS="$HADOOP_OPTS -Djava.library.path=/usr/local/hadoop/lib/"

导出 HADOOP_COMMON_LIB_NATIVE_DIR="/usr/local/hadoop/lib/native/"

有任何想法吗？

java linux hadoop hadoop2 java.library.path

2013-11-13T01:53:24.693

0 投票

7 回答

36557 浏览

hadoop - 名称节点与辅助名称节点

Hadoop 具有一致性和分区容错性，即它属于 CAP 定理的 CP 类别。

Hadoop 不可用，因为所有节点都依赖于名称节点。如果名称节点下降，集群就会下降。

但是考虑到 HDFS 集群有一个辅助名称节点这一事实，为什么我们不能将 hadoop 称为可用。如果名称节点关闭，则可以使用辅助名称节点进行写入。

使hadoop不可用的名称节点和辅助名称节点之间的主要区别是什么。

提前致谢。

hadoop hdfs hadoop2 high-availability

2013-11-14T05:47:05.613

0 投票

0 回答

116 浏览

hadoop2 - Cassandra ColumnFamilyInputformat 在 Hadoop 2.2 上抛出 IncompatibleClassChangeError

当我尝试运行一个与 Cassandra 对话的简单 map reduce 程序时，我收到以下错误。我正在使用 Hadoop 2.2 和 Cassandra 2.0.2。解决此问题的人可以回复解决方案吗？

hadoop2

2014-01-17T17:46:16.620

1 2 3 4 5 6 7 8 9 10