问题标签 [hadoop2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
358 浏览

mapreduce - Hadoop 2 - MapReduce Issue using PIG over hadoop

Im facing an issue while running a MapReduce program using Hadoop 2 (YARN) and Pig. I'm able to read data from Cassandra using Pig script, however when running MapReduce, it is throwing the exception as given below:

0 投票
9 回答
3494 浏览

hadoop - Hadoop gen1 与 Hadoop gen2

我对 Hadoop-2.x 中 tasktracker 的位置有点困惑。

Hadoop-1.x 中的守护进程namenode, datanode, jobtracker, taskracker and secondarynamenode

Hadoop-2.x 中的守护进程namenode, datanode, resourcemanager, applicationmaster, secondarynamenode.

这表示Jobtracker has split up into: resourcemanager and applicationmaster

那么在哪里tasktracker呢?

0 投票
1 回答
1465 浏览

hadoop - Hadoop 2 中的 JobHistory 服务器无法从 HDFS 加载历史文件

错误消息如下所示:

事实上,我知道问题的答案。/mr-history 文件的默认设置为:

hadoop fs -chown -R $MAPRED_USER:$HDFS_USER /mr-history

但是在运行作业时(在 $HDFS_USER 下),作业文件保存到 $HDFS_USER:$HDFS_USER 下的 /mr-history/tmp/hdfs,然后 $MAPRED_USER 无法访问(其中运行 JobHistory 服务器)。再次更改权限后,可以加载作业文件。

但每一份新工作都会再次发生这种情况。那么有人可以帮助我,这是什么永久解决方案,谢谢。

0 投票
3 回答
6734 浏览

hadoop - Hadoop 2.2 namenode 正在运行,但 datanode 未运行

我第一次从本教程(链接)安装 hadoop v2.2。

我的名称节点运行良好http://localhost:50070/
但我的数据节点没有运行:http://localhost:50030/

如果您需要任何命令的输出,请告诉我。

谢谢

0 投票
2 回答
7356 浏览

hadoop - 我应该在 1.x、2.2 和 0.23 中选择哪个 hadoop 版本

您好,我是 Hadoop 新手,对版本名称很困惑,我应该在 1.x(强大的支持和学习资源)、2.2 或 0.23 中使用哪一个。

我已经读到 hadoop 正在从 v0.23 ( link1 ) 完全迁移到 YARN。
但与此同时,hadoop v2.0 正在向 YARN ( link2 ) 迁移,我可以在 Hadoop 2.2 本身中看到 YARN 配置文件。

  • 但是由于 0.23 对我来说似乎是最新版本,所以 2.2 也支持 YARN 吗?(参考链接 1,它说 hadoop 将从 v0.23 开始支持 YARN)
  • 作为初学者,我应该使用 1.x 或 2.x 哪个版本来学习 hadoop 的视角。
  • 其他适用于 hadoop 的技术(如 pig、hive 等)是否可用于最新版本的 hadoop?

谢谢。

更新
谢谢大家的回复。我最终使用了 hadoop2.2,因为所有著名的教程和资源都已过时,尽管我找到了一本好书来开始使用 v2.2。

“Hadoop:权威指南,第三版”,Tom White(在此处购买

支持hadoop v2.2。

源代码在github https://github.com/tomwhite/hadoop-book上给出

正如github上提到的,本书的代码是用

希望能帮助到你..!!!

0 投票
2 回答
2422 浏览

hadoop - Hadoop 2.2.0 Web UI 不显示作业进度

我已经从此链接安装了单节点 hadoop 2.2.0 。当我从终端运行作业时,它可以正常输出。我使用的 Web UI

但是从资源管理器的 Web UI(如上所示)我看不到提交的作业、正在运行的作业等作业进度。

我的 /etc/hosts 文件如下:

我的系统有 IP:192.168.2.96(我试过删除这个 ip 但还是不行)

我提到的唯一主机:端口在 core-site.xml 中,即:

0 投票
2 回答
3322 浏览

java - Driver中的job.setOutputKeyClass和setOutputValueClass与reducer的context.write方法不匹配,程序仍然运行良好。如何?

驱动代码:

减速机代码

在这里,在驱动程序类中我设置了job.setOutputKeyClass(Text.class)and job.setOutputValueClass(LongWritable.class),但在减速器类中我正在编写一个 string context.write(new Text(key1), "ABC");。我认为运行程序时应该会出错,因为输出类型不匹配,并且reducer的键应该实现WritableComparable,值应该实现Writable接口。奇怪的是,这个程序运行良好。我不明白为什么没有例外。

0 投票
0 回答
467 浏览

c++ - 未定义对 hadoopPipes 的引用

我为 MapReduce 任务编写了以下代码

当运行代码以及以下生成文件时:-

显示以下错误:-

在函数partitionReducer::reduce(HadoopPipes::ReduceContext&)': partitionMR.cpp:(.text._ZN16partitionReducer6reduceERN11HadoopPipes13ReduceContextE[partitionReducer::reduce(HadoopPipes::ReduceContext&)]+0x1a9): undefined reference toHadoopUtils::toString(int)' collect2: ld 返回 1 退出状态 make: * [partitionMR] 错误 1

关于我得到的错误的任何线索?!?

请帮助!谢谢 !

0 投票
1 回答
688 浏览

hadoop2 - 从 Mysql 导入数据到 hdfs 时出错

我有 3 个节点的 hadoop 2.2.0 集群,上面安装了 sqoop 2。当我启动 sqoop 服务器时,出现以下异常:

原因是什么?

0 投票
3 回答
3477 浏览

hadoop - 无法正常启动hadoop datanode

我正在尝试安装 hadoop 2.2.0 我在启动 dataenode 服务时遇到以下错误,请帮助我解决这个问题。在此先感谢。

2014-03-11 08:48:16,406 INFO org.apache.hadoop.hdfs.server.common.Storage:锁定 /home/prassanna/usr/local/hadoop/yarn_data/hdfs/datanode/in_use.lock 由节点名获取3627@prassanna-Studio-1558 2014-03-11 08:48:16,426 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode:块池块池 BP-611836968-127.0.1.1-1394507838610 初始化失败(存储id DS-1960076343-127.0.1.1-50010-1394127604582) 服务到 localhost/127.0.0.1:9000 java.io.IOException:/home/prassanna/usr/local/hadoop/yarn_data/hdfs/datanode 中的集群 ID 不兼容:namenode clusterID = CID-fb61aa70-4b15-470e-a1d0-12653e357a10;数据节点集群 ID = CID-8bf63244-0510-4db6-a949-8f74b50f2be9 在org.apache.hadoop.hdfs.server.datanode.DataStorage.doTransition(DataStorage.java:391) 在 org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:191) 在 org.apache。 hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:219) 在 org.apache.hadoop.hdfs.server.datanode.DataNode.initStorage(DataNode.java:837) 在 org.apache.hadoop.hdfs。 server.datanode.DataNode.initBlockPool(DataNode.java:808) 在 org.apache.hadoop.hdfs.server.datanode.BPOfferService.verifyAndSetNamespaceInfo(BPOfferService.java:280) 在 org.apache.hadoop.hdfs.server.datanode。 BPServiceActor.connectToNNAndHandshake(BPServiceActor.java:222) at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.run(BPServiceActor.java:664) at java.lang.Thread.run(Thread.java:662) 2014- 03-11 08:48:16,427 警告组织。apache.hadoop.hdfs.server.datanode.DataNode:结束块池服务:块池BP-611836968-127.0.1.1-1394507838610(存储ID DS-1960076343-127.0.1.1-50010-1394127604582)服务到localhost/127.0。 0.1:9000 2014-03-11 08:48:16,532 INFO org.apache.hadoop.hdfs.server.datanode.DataNode:删除块池 BP-611836968-127.0.1.1-1394507838610(存储 ID DS-1960076343-127.0.1.1 -50010-1394127604582) 2014-03-11 08:48:18,532 警告 org.apache.hadoop.hdfs.server.datanode.DataNode:退出 Datanode 2014-03-11 08:48:18,534 信息 org.apache.hadoop.util .ExitUtil:退出状态为 0 2014-03-11 08:48:18,536 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: SHUTDOWN_MSG: /1-50010-1394127604582) 服务到 localhost/127.0.0.1:9000 2014-03-11 08:48:16,532 INFO org.apache.hadoop.hdfs.server.datanode.DataNode:删除块池 BP-611836968-127.0.1.1 -1394507838610(存储 ID DS-1960076343-127.0.1.1-50010-1394127604582)2014-03-11 08:48:18,532 WARN org.apache.hadoop.hdfs.server.datanode.DataNode:退出 Datanode 2014-03-1108 :48:18,534 INFO org.apache.hadoop.util.ExitUtil: 退出状态为 0 2014-03-11 08:48:18,536 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: SHUTDOWN_MSG: /1-50010-1394127604582) 服务到 localhost/127.0.0.1:9000 2014-03-11 08:48:16,532 INFO org.apache.hadoop.hdfs.server.datanode.DataNode:删除块池 BP-611836968-127.0.1.1 -1394507838610(存储 ID DS-1960076343-127.0.1.1-50010-1394127604582)2014-03-11 08:48:18,532 WARN org.apache.hadoop.hdfs.server.datanode.DataNode:退出 Datanode 2014-03-1108 :48:18,534 INFO org.apache.hadoop.util.ExitUtil: 退出状态为 0 2014-03-11 08:48:18,536 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: SHUTDOWN_MSG: /18,534 INFO org.apache.hadoop.util.ExitUtil:退出状态为 0 2014-03-11 08:48:18,536 INFO org.apache.hadoop.hdfs.server.datanode.DataNode:SHUTDOWN_MSG:/18,534 INFO org.apache.hadoop.util.ExitUtil:退出状态为 0 2014-03-11 08:48:18,536 INFO org.apache.hadoop.hdfs.server.datanode.DataNode:SHUTDOWN_MSG:/* ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * *** SHUTDOWN_MSG:在 prassanna-Studio-1558/127.0.1.1 关闭 DataNode