0

我所做的是在网站上如何在一个非常大的表中有效地选择

我在 R 下使用了 RPostgreSQL 包,因为我想同时操作其他文件。从上面的网站可以看出,表格非常大。使用 RPostgreSQL 完成选择将花费两个多小时。但是今天我在 psql 下使用相同的 SQL 代码,而不是使用 RpostgreSQL。只用了几分钟。为什么?

R的代码是:

sql='SELECT * into new_table FROM table_1 WHERE EXISTS (SELECT 1 FROM table_2 WHERE column=table_1.column_1) AND EXISTS (SELECT 1 FROM table_2 WHERE column=table_1.column_2)'
rs=dbSendQuery(con,sql)

更新:我在python下使用了psycopg2。它也运行得非常快。

4

1 回答 1

0

如果没有数据被发送到R,那么如果有任何差异,那将是令人惊讶的。如果将数据发送R,那可能会相对较慢(我发现在许多情况下数据传输速度更快)psycopg2pandas

根据对其中数据所做的处理R,它可以更有效地使用PL/R

于 2014-12-29T15:04:03.167 回答