假设我有一个日志文件,但没有日期字段或任何其他可用于排序的字段。唯一的提示是文件中的行已经排序(但例如我需要下降排序而不是上升排序)我想做的是在使用 Pig 加载时为每一行生成一个 aftificial ID。是否有我可以使用的内置变量?像 RowId 之类的东西?
你有什么想法吗?
问候, 帕维尔
假设我有一个日志文件,但没有日期字段或任何其他可用于排序的字段。唯一的提示是文件中的行已经排序(但例如我需要下降排序而不是上升排序)我想做的是在使用 Pig 加载时为每一行生成一个 aftificial ID。是否有我可以使用的内置变量?像 RowId 之类的东西?
你有什么想法吗?
问候, 帕维尔