-1

我是 Hadoop 的新手。我已经安装了 hadoop 并且能够编译和运行字数统计示例。

我需要一些有关如何进行文件明智操作的信息。

我有一些数据文件(a.txt,b.txt,.....),其中每个文件都有 100 行带有时间戳和读数的行。我想处理这些文件并为每个文件赋予价值(a-10,b -15,....)。

主要问题是数据行的顺序对于处理很重要。

谢谢你。

4

1 回答 1

0

如果您想在自己的映射器中读取每个文件,可以尝试WholeFileInputFormat

于 2013-09-11T04:32:46.233 回答