下面的问题比 Hadoop 更符合 MapReduce。我需要知道如何将 hadoop 用于以下用例。
用例:从 tsv 文件中读取 1000 万条记录(每条记录有 20 列),并为每条记录生成一个 pdf。
我有以下可用的单元程序。
程序描述:一个静态方法,它接受一个 java 对象(表示单个记录),并返回一个 FilePath 字符串(创建的 pdf)。
程序名称:PdfUtil.createPdf(Record record) - 返回 FilePath 字符串。
在map方法中我应该做什么,在reduce方法中我应该做什么。如果我在 Mapper 的 map 方法中调用 PdfUtil.createPdf 方法,我应该在 Reducer 的 Reduce 方法中做什么?