问题标签 [dbplyr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
303 浏览

r - 从另一个包扩展 S4 类:reconcilePropertiesAndPrototype 错误

我正在尝试编写一个子类,RJDBC::JDBCConnection因为我需要自定义方法来dbplyr使用dplyr#2941中的方法(最初来自这里)连接包。但是,我并没有覆盖这些*.JDBCConnection方法,而是想为JDBCConnection.

因此,根据这个 Stack Overflow question的建议,我编写了我的包,基本上是这样的:

我想扩展的类存在,可以用help("JDBCConnection-class", package = "RJDBC").

在此包中调用devtools::document()会返回以下错误:

我也尝试按照这个 SO question 替换@import@importClassesFrom 结果是一样的。

我怎样才能document()跑步?

0 投票
1 回答
258 浏览

r - 如何使用变量过滤()一个 db-backed tibble?

我正在尝试通过管道传递到filter()命令来过滤数据库支持的 tibble,并且正在观察意外行为:

如果我使用 过滤filter(pos == variable),无论我为变量分配什么值,我都会得到相同的结果。但是,使用值进行过滤,例如filter(pos == 12345)有效 - 对于我过滤的每个不同值,结果都会发生变化。

这是惰性评估还是 tidyeval 的一个方面?filter()使用变量的 DB 支持的 tibble的正确方法是什么?

这是一个可重现的示例:

我的会话信息:

0 投票
1 回答
117 浏览

r - tbl_sql 上的 dbplyr::spread() 问题

这是以下 dbplyr 开发版本的特定问题:

devtools::install_github("tidyverse/dbplyr", ref = devtools::github_pull(72)) 由@edgararuiz 开发

在我看来,传播功能无法正常工作......

我使用以下命令获得了不正确的结果。传播后应该只有一行数据。

在此处输入图像描述

如果将原始数据下载到本地内存,则结果是正确的。

在此处输入图像描述

有人有什么想法吗?另外,我不确定如何联系@edgarauiz。如果有人可以让他知道,将不胜感激。谢谢!

0 投票
0 回答
102 浏览

r - 使用 dbplyr 设置种子

为了从数据库表中采样,我经常使用该模式

有没有办法设置种子以便可以复制样本?

0 投票
1 回答
88 浏览

r - 使用 mutate_if 将时间戳转换为 timestamptz

我有一个带有时间戳(无时区)的数据库,我想在使用collect(). 到目前为止,我已经尝试过这些:

但是,我不知道如何添加AS timestamptz到这个函数调用

它给了我:

但是,我不知道如何paste0()执行而不是被翻译成CONCAT:它给了我:

最终,我试图在没有 R 假设我的本地时区的情况下提取时间戳。

0 投票
0 回答
111 浏览

r - 如何使用 SQL 定义 dbplyr 表

我想用来dbplyr定义一个手写的 SQL查询而不是一个表。我怎样才能做到这一点?

例如,我想做这样的事情:

该变量my_custom_sql_tbl现在将充当tbl(...)R 中的 a,但它会在下面运行自定义 SQL 代码。显然,我打算拥有比我在 dbplyr 中可以轻松完成的事情更有趣/更复杂的 SQL。

我尝试了上述方法,但没有奏效。它返回“表或视图不存在”或“标识符太长”的错误。

有什么建议么?

0 投票
2 回答
88 浏览

r - dbplyr 中 database.table 的语法?

我连接到我们的数据库:

我知道这是成功的,因为当我运行它时,在 RStudio 的右上角我可以看到我们所有的数据库和表。

我的问题是,如何选择特定的数据库表组合?文档显示了用户选择单个表“航班”,但我需要执行 somedatabase.sometable 的等效操作。

试过:

然后尝试:

我也尝试删除引号“”。

在 RStudio 的连接窗格中,我可以看到 somedb.sometable。在那里!如何将其保存到变量 mytable?

0 投票
1 回答
198 浏览

r - in_schema 返回 2 的列表而不是 tbl

我连接到我们的数据库:

我知道这个骗局正在工作,因为我可以在右上角的连接窗格中看到我们所有的模式。

如果我想选择一个特定的表作为 tbl 我可以去:

我希望这里的结果是 df 或 tbl 但它是 2 的列表。我试图提取 tbl 部分,但我被这个列表弄糊涂了。

这是str:

我在这里看什么?如何从 mydb.mytable 获取表作为 tbl?

0 投票
0 回答
161 浏览

r - 使用 `r-dbi` 和 `dbplyr` 通过 RStudio 连接到 Redshift 数据库中的数据库

我对数据库和 Redshift 都比较陌生,我想使用 R Studio 中的Connections来查询一组数据库以提取数据子集。

具体问题:在 Redshift 中连接到正确的数据库后,我该如何指定子数据库及其使用的表dbplyr

主数据库是production,其中有几个子数据库 (?),例如customerdbsupplierdbmembersdb..,每个子数据库都有几个表。假设我想将表companies中的数据子集化customerdb,我试图通过以下方式做到这一点:

查看了各种资源,从 AWS 到 dbplyr 的页面,以及其他 SO 问题,似乎都没有显示这种设置样式或连接到基础表的方法。

0 投票
1 回答
59 浏览

r - 与期货异步收集数据库查询

我正在尝试异步化我的 dbplyrs 查询,但目前它不起作用:

这里有什么问题?(对不起德语错误)

(计划稍后改进问题)