2

我正在关注本教程http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster

我想查看哪个方法或 java 进程使用所有 CPU 作为 wordCount 映射器,通过使用 yourkit 遍历语料库。据我了解,Hadoop 类型“文本”在 utf-8 中,Java 字符串在 utf-16 中。我试图看到 wordCount 映射器在从 utf-8 转换为 utf-16 方面所做的大部分工作。

但是,yourkit 没有显示有关此过程的太多详细信息。它只显示 CPU 时间如下: org.apache.hadoop.mapred.Child.main(String[]) ~ 96% 和 org.apache.hadoop.hdfs.DFSClient$DFSOutputStream$ResponseProcessor.run() ~ 4%

我对你的工具包不是很熟悉。有人可以指出我应该如何处理这个问题吗?

4

0 回答 0