3

我可能缺少一些非常微不足道的东西,但我无法让它发挥作用。我有一个“电影”对象,带有标题、演员、年份和角色。现在我想要的是得到带有标题的结果,以及一个包含演员/角色对的嵌套包。

如果我只是这样做group movies by title,我最终会得到像 (title, {movie objects}) 这样的结果,这将是完美的,除了标题和年份也出现在那里的电影对象中。我只想要演员和角色。

我也尝试过foreach movie_groups generate group, movies.actor, movies.role,但最后我得到了 (title, {all actor}, {all roles}),这显然是错误的。

在 SQL 中,这将是如此微不足道,以至于我不禁为无法弄清楚这一点而感到难以置信的愚蠢。有人有什么建议吗?

4

1 回答 1

5

查看电影的格式会很有帮助,但我假设它是这样的:

MovieTitle1 Year1 Actor1 Role1
MovieTitle1 Year2 Actor2 Role2
etc.

在这种情况下,我会这样做:

result = FOREACH (GROUP movies BY title)  
         GENERATE FLATTEN(group), movies.(actor, role) AS actors ;

此外,您提到电影也包含年份。如果您不需要该字段,则可能值得首先仅投影您需要的字段(标题、演员、角色)。

于 2013-06-28T18:39:57.937 回答