问题标签 [sqldf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1293 浏览

r - 使用 RMySQL 包的 dbGetQuery 查询多个表

在 dbConnect 的帮助下,与 SQL DB(例如 DB1 和 DB2)建立了多个连接。如何编写涉及 DB1 和 DB2 表的查询?dbGetQuery 是否允许只查询一个数据库?建立数据库连接后可以利用 sqldf 包吗?

0 投票
2 回答
1259 浏览

r - 查找由 R 中的两个参数或 R 的 sqldf 聚合的最大值、第二个最大值和第三个最大值

因此,我试图找到数据集的每个客户 ID 每年的最大、第二个最大和第三个最大用水量。我正在使用 R 和 sqldf 库,但我对任何 R 解决方案持开放态度。这是一些示例数据:

理想情况下,我想返回三个矩阵,,,,max1列,,,max2(或第二个最大值或第三个最大值,分别) 等等。max3IDYearMaxmax1 = [101, 2009, 375, 101, 2010, 381, 102, 2009, 275, 102, 2010, 469]

我最初的方法是使用listofIDsandlistofYears作为 and 的域ID创建一个嵌套的 for 循环Year,例如:

然后排序monthlylist并取出最大值等。但sqldf不会读取这样的变量,所以我必须每次明确说明 where ID = 101, where 。ID = 102

关于如何让 sqldf 识别我的变量的任何想法,或者找到按年份和 ID 聚合的最大值、第二个最大值和第三个最大值的更好方法?我正在处理大型数据集,因此理想情况下不会永远持续下去。

0 投票
1 回答
7082 浏览

r - Update function sqldf R Language

I have a problem with SQLdf. Although I am trying to update a table, it always gives NULL as an output. I red things about this problem but I cannot figure out how to solve it. My code is:

But after I check it to see if something has changed, all are the same as in the beginning. Any ideas would help.

0 投票
3 回答
5793 浏览

r - 如何将列名作为参数传递给 R sqldf 中的 SQL?

如何将列名作为参数传递给 R sqldf 中的 SQL?

两者都不

或者

作品。

0 投票
3 回答
2113 浏览

sql - RODBC:合并来自不同数据库的表(通道)

我正在使用 RODBC 包从 R 连接到 Oracle 数据库,但我没有成功合并来自不同数据库的表而不“下载”表(我不想下载它们,因为它们太大了!)。我想使用类似的东西:

如果有人有想法,那将非常有帮助!提前谢谢了。

莱昂内尔

0 投票
1 回答
1510 浏览

r - 如何将多个大型 data.table 对象附加到单个 data.table 并快速导出到 csv 而不会耗尽内存?

对此的简单答案是“购买更多 RAM”,但我希望得到更有建设性的答案并在此过程中学到一些东西。

我正在运行具有 8GB RAM 的 Windows 7 64 位。

我有几个非常大的 .csv.gz 文件(未压缩约 450MB),它们的头信息与我读入 R 并执行一些处理的完全相同。然后,我需要将处理后的 R 对象组合成一个主对象并写回磁盘上的 .csv。

我对多组文件执行相同的操作。例如,我有 5 个文件夹,每个文件夹中有 6 个 csv.gz 文件。我最终需要 5 个主文件,每个文件夹一个。

我的代码如下所示:

此代码不起作用。cannot allocate memory在它写出最终的 csv 之前我得到了错误。我在运行此代码时正在观看资源监视器,但不明白为什么它会使用 8GB 的​​ RAM 来执行此处理。所有文件大小的总和大约为 2.7GB,所以我预计 R 将使用的最大内存为 2.7GB。但是 write.csv 操作似乎使用与您正在写入的数据对象相同的内存量,因此如果您在内存中有一个 2.7GB 的对象并尝试将其写出,您将使用 5.6GB 的内存。

这个明显的现实,再加上使用一个for内存似乎没有得到充分释放的循环似乎是问题所在。

我怀疑我可以使用此处此处sqldf提到的包,但是当我将语句设置为等于 R 变量时,我最终遇到了相同的内存不足错误。sqldf

0 投票
3 回答
4316 浏览

mysql - 在 R 中使用 sqldf - 无法指定正确的用户名

我只是为了好玩才下载了R一个名为的包sqldf,但到目前为止还不能正确运行它。当我尝试使用iris数据集进行一些查询时:

发生错误说Error in mysqlNewConnection(drv, ...) : RS-DBI driver: (Failed to connect to database: Error: Access denied for user 'myUserName'@'localhost' (using password: NO) ) Error in !dbPreExists : invalid argument type

所以我打开了它的帮助文档,然后运行以下查询:

错误消息与上述相同,这意味着我未能user正确指定我的参数,因为错误消息不会更改为Access denied for user 'myUser'@'localhost').

那么如何修复它并正确运行它呢?

当我使用 时,为了您的信息RMySQL,我使用以下参数来建立连接。

我在 OS X 10.9.1 上并使用通过自制软件安装的 MySQL 5.6,以及 R 版本 3.0.2 和 sqldf 版本 0.4-6。

谢谢。

0 投票
0 回答
489 浏览

sql - 从多个节点读取/写入 SQLite 中的同一个表/数据库

我使用 R 创建了一个 SQLite 数据库,现在我想多次读取它(从可以访问同一个 sqlite DB 的多个内核并行)并多次写入另一个 DB,大约并行 1,000 次或更多次。但是,当我尝试执行此类操作时,出现以下错误:

在我的脚本中,我正在运行以下两个我认为会给出错误的命令(不确定它是来自读取还是写入):

你知道这样的操作是否可行吗?如果是这样,无论如何要这样做并避免此类错误?我之前问过这个问题,我被提到数据库的 ACID 设计,这让我认为这样的操作应该是可能的,但不知何故它不起作用。

我也愿意接受建议,比如哦,你可以使用 MySQL 来做到这一点,应该会更好,等等。

谢谢!

0 投票
2 回答
1164 浏览

sql - 连接文本文件并将它们导入 SQLite DB

假设我有数千个逗号分隔的文本文件,每个文件有 1050 列(无标题)。有没有办法将所有文本文件连接并导入到一个表中,一个 SQLite 中的数据库(理想情况下,我会使用 R 和 sqldf 与 SQlite 进行通信)。

IE,

每个文件被调用,table1.txt,table2.txt,table3.txt;所有不同的行数,但相同的列类型,以及 IDs 列(每个文件的第一列)中的不同唯一 ID。

实际示例几乎相同,但列和行更多。如您所见,每个文件中的第一列对应一个唯一 ID。

现在我希望我在超级表中的新表,在数据库中,super.db 是(也是唯一索引的):

作为参考,我使用的是 SQLite3;我正在寻找一个可以在后台运行而无需交互式登录到 sqlite3 解释器的 SQL 命令,即 IMPORT bla INTO,...

我可以在 unix 中尝试:

然后是一个 .sql 文件,

但是这个命令不起作用,因为我使用的是 R sqldf librarydbGetQuery(db, sql)而且我不知道如何在 R 中创建这样的字符串而不会出错。

ps 我问了一个类似的 Q 从数据库中追加表,但这次我需要追加/导入文本文件而不是数据库中的表。

0 投票
3 回答
1102 浏览

r - 使用 sqldf 包创建时间间隔

这就是我的数据框的样子。

我想创建 15 分钟或 30 分钟的时间间隔,并获得No_Words该时间间隔内所有时间戳的总和。我需要这个来绘制每个时间间隔的平均单词数。

我应该怎么做?

另外,我真的很想知道是否可以使用sqldfpackage.json 解决方案。