问题标签 [sqldf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - R 中的类似 SQL 的功能
我习惯于用 SQL 编写数据操作逻辑,现在我正在学习 RI,发现自己有时只想做一些在 SQL 中很简单的事情,但我必须用 R 学习一堆东西才能在 R 上做同样的操作数据框。有没有简单的解决方法?
r - R:如何在不耗尽内存的情况下绑定两个巨大的数据帧
我有两个数据框df1
,df2
每个都有大约 1000 万行和 4 列。我使用 RODBC/sqlQuery 将它们读入 R 没有问题,但是当我尝试rbind
它们时,我得到了最可怕的 R 错误消息:cannot allocate memory
. 必须有更有效的方法来更有效地做事rbind
——有人想分享他们最喜欢的技巧吗?例如,我在文档中找到了这个例子sqldf
:
这是最好的/推荐的方法吗?
更新
我使用dbname = tempfile()
中的关键参数sqldf
,正如 JD Long 在他对这个问题的回答中所建议的那样
sql - SQLDF 错误 - 语法错误
我正在运行以下命令:
但最终得到以下错误。
谁能告诉我怎么回事。
r - 如何将 R 变量传递给 sqldf?
我有一些这样的查询:
但我有"AndhraPradesh"
一个变量stateValue
。如何在 R 的选择查询中使用此变量以获得与上述相同的结果。
请告诉我语法。
macos - R中的sqldf包,查询数据框
我正在尝试使用 R 中的 sqldf 库重写一些代码,这应该允许我在数据帧上运行 SQL 查询,但是我遇到的问题是,每当我尝试运行查询时,R 似乎都在尝试查询我使用的实际真正的 MySQL db con 并通过我试图搜索的数据框的名称查找表。
当我运行这个:
我得到:
mysqlNewConnection(drv, ...) 中的错误:RS-DBI 驱动程序:(无法连接到数据库:错误:无法通过套接字 '/tmp/mysql.sock' (2) 连接到本地 MySQL 服务器)
当我尝试使用两种不同的方式指定位置时(第一种形式是 googlecode 页面,第二种方式应该根据文档正确)
所以,我认为这个包 tcltk 可能有问题,我从未听说过,所以我尝试解决这个问题并找到一些问题:
!dbPreExists 中的错误:参数类型无效
在这里,我真的不知道问题是什么,我需要移动一些东西吗?
我尝试的另一种方法是在对数据框对象运行查询之前,设置我的数据库连接,以便 R 会在那里查看,而不是尝试连接到实际的本地 MySQL 数据库。但这没有用。回到套接字的问题(即使我可以毫无问题地查询本地数据库本身。
最终,我想查询例如 C 的值大于 2 的记录数,我觉得这样做很舒服。唯一的问题是我不知道是否有另一种方法可以指定我正在查询的是数据框而不是实际的数据库。我在这里错过了一些非常愚蠢和容易的东西吗?
谢谢!
macos - 运行 Mac OS X 的 R tcl/tk 包不工作
我在 Mac OS X 10.7.2 (Lion) 上安装了 R 2.14。
我注意到当我尝试使用 sqldf 包时,R 挂起。我按照 sqldf 帮助的建议尝试了修复,即执行:
在加载 sqldf 包之前。这不起作用。我安装了 tcltk-8.5.5-x11.dmg 包,但仍然没有变化。
我尝试安装 XQuartz 软件 (xquartz.macosforge.org/)。尽管如此,当使用 sqldf 或加载 tcltk 包时,R 仍然挂起。
有人对这个问题有建议吗?
r - sqldf中按组的累积总和?
我有一个包含 3 个变量的数据框:地点、时间和值(P、T、X)。我想创建第四个变量,它将是 X 的累积和。通常我喜欢用 进行分组计算sqldf
,但似乎找不到 的等价物cumsum
。那是:
不起作用。这甚至可能sqldf
吗?我试过doBy
了,但这也不是全部cumsum
。
sql - 使用 sqldf 的 NA 值
如果我尝试从 SQL 中获取平均c(NA, NA, 3, 4, 5, 6, 7, 8, 9, 10)
使用AVG
量,我得到的值为 5.2,而不是预期的 6.5。
这让我相信 sql(df) 将 NA 值视为零。是否可以在 SQL 调用中忽略(排除)NA 值,因为它可以使用na.rm
参数(在 R 中)来完成?
r - sqldf:将时间戳从本地时间更改为 GMT/UTC
在我的机器上,sqldf 将 POSIXct 从本地时间(我在 CST,GMT -0600)更改为 GMT/UTC。这是预期的行为吗?我可以阻止 R 或 sqldf 这样做吗?这是我的代码: