我正在尝试将dplyr
/ dbplyr
( version 0.7
) 与数据库 ( Microsoft SQL Server 2014
) 一起使用。我已经能够连接到这个并使用RODBC
,DBI
和odbc
包提取数据。当我尝试将 dplyr 动词直接与基础一起使用时,就会出现问题。
当我尝试使用dplyr
时,我收到以下错误:
Error in new_result(connection@ptr, statement) : std::bad_alloc
我在dplyr repo上提出了这个问题,Hadley 告诉我这很可能是一个odbc
错误。当我在 repo 上提出问题时,Jim 非常有帮助odbc
,但无法解决问题。
要清楚:
RODBC::sqlQuery()
并且DBI::dbGetQuery()
两者都有效:我得到了一个我期望的数据框,我可以使用SQL
查询来取回我想要的任何东西。我只在尝试使用dplyr
动词时遇到内存分配错误(实际上,即使我尝试tbl()
)。有很多数据,但我正在查询其中的一个子集,它很适合 R 内存。
理想情况下,如果可能的话,我宁愿将数据完全保留在R 的内存之外。这样做的原因是我正在构建一个Shiny
应用程序,该应用程序将根据用户选择的数据的各个方面生成绘图等。可以想象,每次用户执行此操作时连接到数据库、发送查询和接收数据都会使应用程序有些无用,因为它太慢了。我的理想情况是这样的RStudio
例子:
my_db <- src_mysql(
dbname = "shinydemo",
host = "shiny-demo.csa7qlmguqrf.us-east-1.rds.amazonaws.com",
user = "guest",
password = "guest"
)
> my_db %>% tbl("City") %>% head(5)
# Source: lazy query [?? x 5]
# Database: mysql 10.0.17-MariaDB [guest@shiny-demo.csa7qlmguqrf.us-east-1.rds.amazonaws.com:/shinydemo]
ID Name CountryCode District Population
<dbl> <chr> <chr> <chr> <dbl>
1 1 Kabul AFG Kabol 1780000
2 2 Qandahar AFG Qandahar 237500
3 3 Herat AFG Herat 186800
4 4 Mazar-e-Sharif AFG Balkh 127800
5 5 Amsterdam NLD Noord-Holland 731200
但是,以我的基础,我无法做到这一点。任何帮助将不胜感激。