0

我在 Windows 7 上使用 SQL Server 2008 和 RGui(64 位)。我能够使用 RODBC 从 R 连接到 SQL Server,并在变量中获取数据集。理想情况下,我想直接从结果集中抽取一定百分比的记录集(比如 10%)或固定数字(比如 25)。

作为权宜之计,我将记录集转储到一个文件中并从那里采样。

有人可以告诉我如何直接从结果集中采样。

到目前为止的代码:

> library (RODBC)
> conn <- odbcConnect ("TestR", "<username>")
> rs <- sqlQuery ("select Col1 from MyTable")
> sampleDocs <- sample (rs, size = 25, replace = TRUE, prob = NULL)

> set.seed(100)

> write.table(rs, file="C:\\FromTable.txt", row.names=FALSE, col.names=FALSE)
> docs <- read.table ("C:\\FromTable.txt")

> sampleDocs <- sample(docs$V1, size=101, replace=FALSE, prob=NULL)
> write.table(sampleDocs, file=\"C:\\\\SampleDocs.txt\", row.names=FALSE,
               col.names=FALSE)
4

1 回答 1

0
sampleDocs2 <- sample(rs$ColName, size=10, replace=FALSE, prob=NULL)

这样就可以了!

于 2013-03-11T17:10:38.323 回答