1

我试图找出这些函数的作用,但我找不到太多关于它的信息,而且从我发现的内容中也不是很清楚。他们在做什么?

4

1 回答 1

1

当您开始使用 Revo R 或查看给出的演示时,通常会看到函数直接应用于文件路径,如下所示:

# Create a point to an insurance claims dataset installed with RRE
xdfPath <- file.path(rxGetOption("sampleDataDir"), "claims.xdf")

rxDataStep(xdfPath, numRows = 6)

然而,在幕后,rxDataStep正在围绕该文件路径创建一个包装器,其中包含使用它所需的信息 - 文件类型、要读取的变量、字符向量是否应转换为因子等。该包装器称为 "数据源”,RxXdfData是用于创建它的函数。RxTextData是一样的,只是对于文本文件:

# Create a point to an insurance claims dataset installed with RRE
textPath <- file.path(rxGetOption("sampleDataDir"), "claims.txt")

rxDataStep(textPath, numRows = 6)

您通常可以让 RRE 函数为您处理这个问题。如果您的文件在不同的分析中应具有不同的默认设置,则创建数据源会很有用。它们还有另一个优点:因为数据源是真正的 R 对象,而不仅仅是文件路径,您可以在它们上使用一些开源 R 函数:

# This doesn't work like we'd expect:
head(xdfPath)

# These do:
xdfSource <- RxXdfData(xdfPath)
head(xdfSource)
names(xdfSource)
nrow(xdfSource)
summary(xdfSource)

这很整洁,但不会改变世界。

rxXdfToDataFrame只是让您将 XDF 文件转换为内存数据帧,如下所示:

rxXdfToDataFrame(xdfSource)

rxDataStep...如果你不给它一个,这也是什么outFile,所以我通常使用它,rxDataStep因为它更容易输入。

于 2015-08-14T22:05:17.833 回答