好的,所以,在 scalding 中,我们可以轻松地使用矩阵,使用矩阵 api,这没关系 - 以这样的方式:
val matrix = Tsv(path, ('row, 'col, 'val))
.read
.toMatrix[Long,Long,Double]('row, 'col, 'val)
但是我怎样才能将矩阵从格式转换为那种格式,就像我们通常写的那样?有一些优雅的方法吗?
1 2 3
3 4 5
5 6 7
至
1 1 1
1 2 2
1 3 3
2 1 3
2 2 4
2 3 5
3 1 5
3 2 6
3 3 7
我需要这个来对具有巨大尺寸的矩阵进行操作,并且我不知道行数和列数(如果文件可以给出大小?例如 NxM)。
我试图用TextLine( args("input") )
但我不知道如何计算行号。我想在hadoop上转换矩阵,mb还有其他方法如何处理格式?烫伤可以吗?