2

我正在使用 amazon redshift 和 R。我得到了连接。我想创建一些数据库表并通过 R 向其中插入一些数据。但是,这样做时遇到了一些问题

# Set the Java Environment
# For 64 bit connections
Sys.setenv(JAVA_HOME='C:\\Program Files\\Java\\jre1.8.0_121')

# For 32 bit connections
#Sys.setenv(JAVA_HOME='C:\\Program Files (x86)\\Java\\jre1.8.0_121')


# Load libraries if they haven't already
library(rJava)
library(RJDBC)

# Get the driver
jdbcDriver <- JDBC(driverClass="com.amazon.redshift.jdbc41.Driver",   
                   classPath="drivers/RedshiftJDBC41-1.2.1.1001.jar")

# Connect to the database
jdbcConnection <- dbConnect(jdbcDriver, 
                            "server",
                            "username", "password")

数据库已连接,没有问题。现在我想创建一个表并将数据插入其中。我正在使用sqlCreateTableandsqlAppendTable来创建数据并将其插入表中。

# Create a table iris, and insert the data into it

sql_required <- sqlCreateTable(jdbcConnection, "iris_table1", iris)

tbl_create <-  dbGetQuery(jdbcConnection, sql_required) 

但是,上述命令会导致以下错误。

# Error in .verify.JDBC.result(r, "Unable to retrieve JDBC result set for ",  : 
#                                Unable to retrieve JDBC result set for CREATE TABLE "iris_table1" (
#                                  "Sepal.Length" DOUBLE PRECISION,
#                                  "Sepal.Width" DOUBLE PRECISION,
#                                  "Petal.Length" DOUBLE PRECISION,
#                                  "Petal.Width" DOUBLE PRECISION,
#                                  "Species" VARCHAR(255)
#                                )
# ([JDBC Driver]com.amazon.dsi.dataengine.impl.DSISimpleRowCountResult 
#   cannot be cast to com.amazon.dsi.dataengine.interfaces.IResultSet)

尽管如此,该表已创建并将通过以下命令列出

sql_required <- "SELECT TABLE_NAME
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_TYPE = 'BASE TABLE' AND TABLE_CATALOG=\'demodata\'"

tables_in_reshift <- dbGetQuery(jdbcConnection, sql_required)
tail(tables_in_reshift, 1)

#   table_name
# 141 iris_table1

我什至可以插入数据

sql_required <- sqlAppendTable(jdbcConnection, "iris_table1", head(iris))


tbl_insert <- dbGetQuery(jdbcConnection, sql_required)

但是,这也会导致跟随错误。

# Error in .verify.JDBC.result(r, "Unable to retrieve JDBC result set for ",  : 
#                                Unable to retrieve JDBC result set for INSERT INTO "iris_table1"
#                              ("Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width", "Species")
#                              VALUES
#                              (5.1, 3.5, 1.4, 0.2, 'setosa'),
#                              (4.9, 3, 1.4, 0.2, 'setosa'),
#                              (4.7, 3.2, 1.3, 0.2, 'setosa'),
#                              (4.6, 3.1, 1.5, 0.2, 'setosa'),
#                              (5, 3.6, 1.4, 0.2, 'setosa'),
#                              (5.4, 3.9, 1.7, 0.4, 'setosa')
# ([JDBC Driver]com.amazon.dsi.dataengine.impl.DSISimpleRowCountResult 
# cannot be cast to com.amazon.dsi.dataengine.interfaces.IResultSet)
# 

然而,数据将被插入,因为以下命令返回 6 条记录

sql_required <- "SELECT * from iris_table1"

inserted_dat <- dbGetQuery(jdbcConnection, sql_required)


#    sepal.length sepal.width petal.length petal.width species
# 1          4.9         3.0          1.4         0.2  setosa
# 2          4.6         3.1          1.5         0.2  setosa
# 3          5.4         3.9          1.7         0.4  setosa
# 4          5.1         3.5          1.4         0.2  setosa
# 5          4.7         3.2          1.3         0.2  setosa
# 6          5.0         3.6          1.4         0.2  setosa

尽管该程序有效,但我担心错误。所以,我的问题是:

试图解释的错误是什么,我该如何摆脱它?
有没有更好的方法(更快、更高效)来创建表并将数据插入到 redshift 中RJDBC?谢谢!

更新 我最初认为运行命令如

sqlCreateTable(jdbcConnection, "iris_table5", iris)

应该足以创建表,但它不创建表也不

sqlAppendTable(jdbcConnection, "iris_table1", head(iris))

将数据附加到数据库表中。

4

3 回答 3

2

我遇到了同样的错误。我在 SQL 工作台中运行查询。所以这绝对不是R的问题。它看起来像一个红移错误。我还更改了 JDBC 版本,但仍然出现相同的错误。与使用相同 JDBC 版本的同事一起测试了该查询,结果对她来说非常有效。我认为 redshift 中的首选语法是 CTAS 语句。同一查询的 CTAS 版本运行良好。我的解决方案是切换到 CTAS 语法。 https://docs.aws.amazon.com/redshift/latest/dg/r_CTAS_examples.html

于 2019-07-11T13:23:53.807 回答
1

以下两个命令:

sql_required <- sqlCreateTable(jdbcConnection, "iris_table1", iris)
tbl_create <-  dbGetQuery(jdbcConnection, sql_required)

创建表只需要第一次调用。从dbGetQuery() 的文档中

此函数仅适用于 SELECT 查询。

但是您不是在进行选择,而是在创建表。您在此处插入数据的调用也是如此:

sql_required <- sqlAppendTable(jdbcConnection, "iris_table1", head(iris))

所以你应该删除那些不必要的调用dbGetQuery(),这应该可以解决这些错误。

我不认为这是必要的,但你可能需要打电话dbCommit()来关闭交易:

dbCommit(jdbcConnection)
于 2017-03-15T01:39:17.303 回答
1

我有同样的错误。如果您查看软件包文档,您会发现:

dbSendQuery并向dbSendUpdate数据库提交 SQL 查询。两者之间的区别仅在于dbSendUpdateDBML查询一起使用,因此不返回任何结果集。

所以使用dbSendUpdate而不是dbSendQuery对我有用。

于 2019-05-17T02:15:38.070 回答