问题标签 [dbplyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 dplyr 中,sql builder 是如何工作的?
在 R 中,我们可以有以下表达式:
执行
但是如果你有 tbl(con, "table1"),它会执行 select * from table。
第一个函数 tbl(con, "table1") 如何知道它有链接到它的附加函数,并且需要等待链结束才能构建正确的 sql 查询并执行命令。是的,我知道它使用惰性求值,但是我无法编写一个简单的玩具示例来以相同的方式构建一个字符串
IE
打印出“我什么都不需要”
和
打印出“我需要买苹果和橘子”
r - 如何在 dbplyr 中使用自定义 SQL 函数?
我想计算数据库中的 Jaro-Winkler 字符串距离。如果我将数据带入 R (with collect
),我可以轻松地使用包中的stringdist
函数stringdist
。
但是我的数据非常大,我想在将数据拉入 R之前过滤 Jaro-Winkler 距离。
Jaro-Winkler 有 SQL 代码(https://androidaddicted.wordpress.com/2010/06/01/jaro-winkler-sql-code/和T-SQL版本)但我想我不知道如何最好让该 SQL 代码与dbplyr
. 我很高兴尝试将该stringdist
函数映射到 Jaro-Winklersql
代码,但我不知道从哪里开始。但即使是像直接从 R 对远程数据执行 SQL 代码这样更简单的事情也会很棒。
我曾希望文档中的SQL 翻译dbplyr
可能会有所帮助,但我不这么认为。
r - 将变量添加到 MonetDBLite 中的表
这是 MonetDBLite 数据库文件中的 mtcars 数据。
我应该如何向 MonetDBLite 中的表 mtcars_1 添加列/变量“新”?
r - 直接使用 dplyr 改变数据库表中的变量
这是 MonetDBLite 数据库文件中的 mtcars 数据。
我想使用 dplyr mutate 创建新变量并将其添加(提交!)到数据库表中?就像是
当我们这样做时,所需的输出应该是相同的:
怎么能这样做?
r - 使用 ALTER TABLE 和 UPDATE 在数据库中创建变量
我有一个 50GB 的 SQLite 数据库文件,我想计算和添加新变量。您可以利用Moody_Mudskipper 的函数或使用ALTER TABLE 和 UPDATE的东西来创建变量而不是整个表吗?
r - 在“dplyr”数据管道函数中将排序方向传递给“arrange”
我有一个函数可以用我的数据做很多事情。但是我想添加一个排序顺序参数,允许我在将参数传递给函数时以相反的方向一步翻转数据。而且我需要该函数与dbplyr
.
我目前的解决方案似乎真的很不优雅。我有两个完整的数据管道,一个有一个desc()
,一个没有。这感觉真的很笨重,但由于我必须desc()
在我的领域中环绕,我dplyr
想不出还有什么办法做到这一点。一个想法可能是创建一个排序参数,或者1
在-1
排序之前将其乘以我的字段。有没有更简单或更简单的方法来做到这一点?
这是一个简单的玩具示例,展示了我如何创建两个管道:
这里使用了一个排序参数,该参数映射到一个fac
要么是1
要么-1
r - 过滤数据框中的两组日期
我正在使用 DBPLYR 访问数据库。但是,我想过滤两组日期。我知道如何在 SQL 中执行此操作,但在 dplyr 或 dbplyr 中不知道。
用于此的 SQL 代码将是
我如何将其转换为 dplyr 语法?
r - 在 SQLite 中使用子查询更新表
我想使用ALTER TABLE
andUPDATE
语句在我的表中添加一列,而不是重新创建完整的表。
在我的UPDATE
语句中使用子查询时,我没有得到我期望的输出。
构建可重现的数据
在单独的表中创建新列
在旧表中创建新列
尝试从new_table
那里插入新列
如您所见, mynew_col
仅包含6.5
我希望3.2
在最后一行中具有的值。我怎样才能解决这个问题 ?
r - 如何使用 pool 包逃脱 Athena database.table?
我正在尝试通过 JDBC 连接到 Amazon Athena 并且pool
:
到目前为止的工作:
---> 工作正常。正在返回正确的数据。
这不起作用:
这里的问题是 Athena 需要以下语法作为 SQL:
任何一个:
或者:
所以基本上,通过传递字符串"myDB.myTable"
:
正在使用以下语法:
由于此类表不存在,因此导致以下错误:
我试过的:
因此,我试图通过或"myDB"."myTable"
不成功:myDB.myTable
tbl()
我试过使用capture.output(cat('\"myDB\".\"myTable\"'))
:
r - 如何在 dbplyr 中执行 floor_date()
我正在尝试通过平均将分钟级时间序列数据聚合到每小时级。
为了做到这一点,我想计算一个小时列,其中包含读数发生的日期和时间。然后我可以做一个简单的group_by
summarise
. 例如,我的tbl_df
样子:
我想要一个像这样的新专栏:2018-07-06 20:00:00.000
或2018-07-06 20:00:00.000
。
通常我会使用floor_date(time, "hour")
from lubridate
,甚至str_replace(time, ".{2}(?=:[^:]*$)", "00")
,但我的 SQL Server 连接都不适合我。
知道这是如何在 R 中完成的吗?答案必须是 R 代码,最好是 dplyr 代码,例如:
或者