Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我是 Hadoop 的新手。我已经安装了 hadoop 并且能够编译和运行字数统计示例。
我需要一些有关如何进行文件明智操作的信息。
我有一些数据文件(a.txt,b.txt,.....),其中每个文件都有 100 行带有时间戳和读数的行。我想处理这些文件并为每个文件赋予价值(a-10,b -15,....)。
主要问题是数据行的顺序对于处理很重要。
谢谢你。
如果您想在自己的映射器中读取每个文件,可以尝试WholeFileInputFormat