0

我正在尝试从一个非常大的数据库中读取,该数据库由地理参考的时间序列数据组成。所以我有以下格式的文件:

纬度,经度,值@time1,值@time2,....值@timeN。

所以这是整个地球的数据。现在,对于我的工作,我需要将纬度、经度作为键,将时间序列值作为值。据我所知,Hadoop 有 KeyValueInputFormat,但它认为第一个选项卡是分隔符。有没有办法自定义它?我需要一个解决方案。

4

1 回答 1

0

玩弄

key.value.separator.in.input.line

在作业配置中。

于 2012-07-27T14:56:29.853 回答