2

我创建了一个 sparkR 数据框,人们

+----+-------+
| age|   name|
+----+-------+
|20.0|Michael|
|30.0|   Andy|
|19.0| Justin|
+----+-------+

如何在“年龄”列中选择第一个值。在 R 语言中,我们可以通过 来执行people$age[1],结果为 20.0。我们如何在 sparkR 数据帧中做同样的事情。

TIA,阿伦

4

1 回答 1

4

在 SparkR 中,您首先拥有该功能,该功能仅适用于 DataFrame,不适用于列。因此你可以做

first(people)$age

这仅适用于第一项。SparkR DataFrame 没有行索引,但是您可以使用 head 或 take 来决定要获取多少项:

head(people, 5)$age
take(people, 5)$age

但没有办法只取第五元素。

于 2015-07-22T08:49:27.330 回答