0

假设我有一个日志文件,但没有日期字段或任何其他可用于排序的字段。唯一的提示是文件中的行已经排序(但例如我需要下降排序而不是上升排序)我想做的是在使用 Pig 加载时为每一行生成一个 aftificial ID。是否有我可以使用的内置变量?像 RowId 之类的东西?

你有什么想法吗?

问候, 帕维尔

4

1 回答 1

2

Pig 0.11中的新功能是RANK操作符,它将完成您需要做的事情。

于 2013-10-31T16:44:00.700 回答