我最近开始在hadoop工作,我刚刚学习了一些关于它的基本理论知识。我正在尝试解决应在文本文件中给出输入的任务,例如 input.txt (1 10 37 5 4 98 100 等)
我需要在给定的输入中找到最大的整数(即整数类型)。我正在尝试传递数组列表中的输入,以便我可以将第一个整数与所有整数的其余部分进行比较(使用 for 循环)。
程序应该读取输入文件说一些随机数 100 20 40 90 70,然后输出应该显示为 100。我刚刚尝试使用 map 和 reduce 函数中的 wordcount 示例修改代码。但是由于我是新手,开始使用 hadoop 编码,所以我无法弄清楚我错在哪里。
1)是否有可能以这种方式找到解决方案?如果是,我无法在 hadoop 中创建数组列表,需要一些提示:-)
2)我们可以只打印“键”而不是键值对吗?如果是这样,请帮助我。我试图在 reduce 函数中编写代码以不打印它,但我遇到了一些错误。
请指导我一些提示,我可以通过这些提示继续前进。谢谢