我正在尝试从一个非常大的数据库中读取,该数据库由地理参考的时间序列数据组成。所以我有以下格式的文件:
纬度,经度,值@time1,值@time2,....值@timeN。
所以这是整个地球的数据。现在,对于我的工作,我需要将纬度、经度作为键,将时间序列值作为值。据我所知,Hadoop 有 KeyValueInputFormat,但它认为第一个选项卡是分隔符。有没有办法自定义它?我需要一个解决方案。
我正在尝试从一个非常大的数据库中读取,该数据库由地理参考的时间序列数据组成。所以我有以下格式的文件:
纬度,经度,值@time1,值@time2,....值@timeN。
所以这是整个地球的数据。现在,对于我的工作,我需要将纬度、经度作为键,将时间序列值作为值。据我所知,Hadoop 有 KeyValueInputFormat,但它认为第一个选项卡是分隔符。有没有办法自定义它?我需要一个解决方案。