我在 Windows 7 上使用 SQL Server 2008 和 RGui(64 位)。我能够使用 RODBC 从 R 连接到 SQL Server,并在变量中获取数据集。理想情况下,我想直接从结果集中抽取一定百分比的记录集(比如 10%)或固定数字(比如 25)。
作为权宜之计,我将记录集转储到一个文件中并从那里采样。
有人可以告诉我如何直接从结果集中采样。
到目前为止的代码:
> library (RODBC)
> conn <- odbcConnect ("TestR", "<username>")
> rs <- sqlQuery ("select Col1 from MyTable")
> sampleDocs <- sample (rs, size = 25, replace = TRUE, prob = NULL)
> set.seed(100)
> write.table(rs, file="C:\\FromTable.txt", row.names=FALSE, col.names=FALSE)
> docs <- read.table ("C:\\FromTable.txt")
> sampleDocs <- sample(docs$V1, size=101, replace=FALSE, prob=NULL)
> write.table(sampleDocs, file=\"C:\\\\SampleDocs.txt\", row.names=FALSE,
col.names=FALSE)