hadoop - 在 Hadoop 中自定义 InputFormat

Question

我正在尝试从一个非常大的数据库中读取，该数据库由地理参考的时间序列数据组成。所以我有以下格式的文件：

纬度，经度，值@time1，值@time2，....值@timeN。

所以这是整个地球的数据。现在，对于我的工作，我需要将纬度、经度作为键，将时间序列值作为值。据我所知，Hadoop 有 KeyValueInputFormat，但它认为第一个选项卡是分隔符。有没有办法自定义它？我需要一个解决方案。

score 0 · Accepted Answer

0

玩弄

key.value.separator.in.input.line

在作业配置中。

于 2012-07-27T14:56:29.853 回答

1 回答 1