问题标签 [rpostgresql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 RPostgreSQL 和 dplyr 将 R 连接到 Redshift 的理论是什么
我只知道如何使用 RPostgreSQL 和 dplyr 将 R 连接到 Redshift。但我对几件事感到困惑:
- 当我想在屏幕上显示一些东西时,比如 head(a) ,其中 a 是从 Redshift 检索的结果,它会非常慢。但是,如果我只选择了几个字段,比如说只有 4 列,那么它会快得多。那么 R 是如何连接 Redshift 的呢?
- 如果我想使用一些模型,例如随机森林或广义线性,是否有必要使用 as.data.frame 将结果传输到本地机器上的数据框?我努力了。在使用 ggplot2 绘制图表之前,我必须这样做。
r - 通过 RPostgreSQL 库从 R 将大数据库导入 PostgreSQL
我需要在 PostgresSQL 中导入一个 10.352.223 KB 的数据库。我试图通过 R 中的 RPostgreSQL 库来做到这一点,但我遇到了问题。
我的代码是:
在注册 469000 之前我没有问题,但在某些时候我有这个错误:
如果我跳过很多行并阅读一些特定的行,我无法理解有什么问题。
我能做些什么?我必须直接使用 PosgreSQL 代码吗?R中有更好的方法吗?
我会很感激你的帮助。
rpostgresql - RPostgreSQL将没有所有列的行插入数据库
我正在尝试插入代表 Postgres 数据库的一些但不是所有列的行。特别是,我正在寻求插入除默认设置为当前时间戳的时间戳列之外的所有列。
我尝试了以下方法:
dbWriteTable(con, 'raw_results', df, append = TRUE)
但是,这会返回一个错误,表明其中一列(不是时间戳)不是时间戳的适当格式。
我还尝试写出一个插入语句:
这将返回一条警告消息:
如何通过 R 将简单的插入到 Postgres 数据库中?
r - R - RPostgreSQL 包 - dbWriteTable 到非默认模式,其中目标表包含比数据框更多的字段
问题
我正在尝试将 R 数据框的内容复制到位于 schemadf
的 PostgreSQL 表中。默认情况下,PostgreSQL 会将表写入模式,我不想更改此设置。这种转移的两个独特方面是:table_name
schema_name
public
- 在非默认模式下写入表;和
- 数据帧
df
包含的字段数量少于table_name
. 但是, 中包含的所有字段确实存在于 中。df
table_name
我试过的
我首先尝试通过使用解决方法dbWriteTable
从RPostgreSQL
包中使用:
dbWriteTable(con, c("schema_name","table_name"), df, append = T)
导致以下异常:
然后我尝试dbWriteTable2
从caroline
包(上述dbWriteTable
函数的包装器)中找到我们,但上面使用的非默认模式黑客似乎不起作用:
dbWriteTable2(con, c("schema_name","table_name"), df, append = T, add.id = FALSE)
创建以下异常:
r - 在 R 和 Postgres DBMS 之间传递 POSIXct 对象时如何正确处理时区?
当POSIXct
使用RPostgreSQL
. 在下面的示例中,我定义了两个时间戳字段:一个带时区,另一个不带. 但是,在通过和传递POSIXct
对象时,它们的处理方式似乎完全相同。dbWriteTable
dbReadTable
两个字段的结果完全相同。似乎时区已被完全丢弃。
问题:
- 幕后究竟发生了什么?
- 如何正确地来回传递 POSIXct 的时区?
r - 使用 RPostgreSQL 列出数据库
我正在寻找一个 R 命令来列出 PostgreSQL 服务器中的可用数据库。我在 R 中使用 RPostgreSQL 包。
我知道如何连接到服务器,但我唯一需要知道的是如何列出可用数据库的名称。
sql - 如何有条件地使用 R 中 data.frame 中的值更新数据库中的行
我在 R 中有一个 data.frame -与大约 1000 多行匹配
我有一个 postgresql 数据库表 -带有以下列的list_m
db_name、db_cid、db_weight、processing_status、request_id、fname、mname、lname 等。
我想使用 data.frame 中的值更新表中只有几列(db_c_id、db_weight 和处理状态)的值。
到目前为止,我正在遍历 data.frame 以创建更新查询,然后运行查询。
所以它基本上创建了一个 query1 变量
然后将使用
我想要的是通过参数化值来做到这一点..像
此语句应为匹配 data.frame 的每一行执行。
sql - 如何安排 RPostgreSQL 查询并在 R 中创建协方差矩阵
我想从尚不适合创建协方差矩阵的数据框中创建协方差矩阵。
使用 RPostgreSQL 查询数据库后,我有以下类型的数据框:
整个数据框有约 500 000 行,大约有 16 000 个 item_id。item_id 是重复的(在这里回顾几个月)。
我最终要做的是为 item_id 的值创建一个协方差矩阵。
为此,作为第一步,我想重新排列数据框,最终得到如下所示的数据框:
我的问题是,我不知道以我需要的方式重新排序数据框的方法。
如果有一个 SQL 查询可以让我在检索时选择获得所需的结构,我想那将是最好的。
在 RI 中尝试了一些使用 melt 和 spread 的方法,但是对于我的本地 mac 来说,计算似乎太重了,我上次尝试它时只是在某个时候关闭了。
提前感谢您的帮助!
sql - R 中的 OVER() 函数在没有 RPostgreSQL 的情况下使用 sqldf?
我正在处理一些敏感数据,所以我担心使用 RPostgreSQL。我已将所有必要的数据加载到 R 中的数据帧中。我正在尝试使用sqldf()
R 中的函数对数据运行查询。这些查询是几年前为 Oracle SQL Developer 编写的,因此我们试图避免完全重写脚本. 能够重用预先编写的 SQL 脚本将为我们节省大量时间。当我们点击over()
SQL 函数时,脚本似乎出错了。我知道 base sqldf 不支持该over()
功能。我读过over()
函数适用于 RPostgreSQL 包,但这是否需要我将数据帧发送到外部数据库?根据我对 RpostgreSQL 的理解,您需要连接到 PostgreSQL 并创建一个新数据库。我们无法将此数据发送到外部数据存储系统。是否有另一种方法可以使用该over()
功能,同时将数据帧保持在我的 PC 本地?
r - RPostgreSQL - 将大表导入 R 而不丢失数据
我正在尝试导入一个非常大的数据,其中包括格式为“2015-08-31 07:23:25.3”的时间戳 该表有近 250 万行,当我将其导入数据框时,它会浪费时间。
以上是我使用的代码。它适用于另一个具有相同格式时间戳并且有 800 行的表。
我已经使用以下代码来检查是否隐藏了任何东西......没有运气:-(
请帮忙!