问题标签 [sqldf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
166 浏览

sql - 使用 sqldf 仅显示 count(*) > 2000 的行

我正在尝试使用下面的代码选择除前 2000 行之外的所有行,但出现以下错误。

0 投票
1 回答
744 浏览

r - 如何在 sqldf file.format 中仅指定一些 colClasses?

我有一些 CSV 文件的 sqldf 列有问题,导致一些数字列被归类为字符。我怎样才能只为这些列指定类,而不是每一列?有很多列,我不一定要为所有列指定类。

这些问题列中的大部分数据都是零,因此当它们是数字(或实数)数据类型时,sqldf 将它们读取为整数。请注意, read.csv 正确分配了类。我不够聪明,无法生成具有正确属性的合适数据集(前 50 个值为零,然后在第 51 行中的值为 1.45),但这是一个加载数据的示例调用:

返回此错误:

我可以以某种方式使用另一个 read.table 调用来计算数据类型吗?我可以将所有列作为字符读取,然后将一些转换为数字吗?有一小部分数字是字符,与所有数字列相比,指定这些数字会更容易。我想出了这个丑陋的部分解决方案,但它仍然在最后一行失败并显示相同的错误消息:

0 投票
1 回答
2606 浏览

r - 在本地安装 R 包“sqldf”(RSQLite.extfuns)

我正在尝试在sqldf没有 root 访问权限的 Linux pc 上安装 R 包。当 R 尝试安装软件包RSQLite.extfuns时,由于缺少库sqlite3ext.h而失败。由于我无法全局安装该库,因此我在我的主目录中下载并编译了它。但是我现在如何告诉R(或 gcc)图书馆的位置。它搜索/usr/local/include/usr/lib64/R/library/...我无权访问这些位置。

提前致谢!

0 投票
3 回答
122 浏览

r - 使用 R 的从哪里选择过程

我有两个数据框,这是第一个:

第二个:

我想要做的是让那些行 in ,对于(a,b,c 等) wheredf2的每个值(在这种情况下都是行),大于in分组。pd=1y2y1pdf

因为这个解释可能没有意义,需要踢的两行:line 1 indf2,因为 for ay2=3大于y1=2in df第 6 行,因为 for cin df2y值为 4,但 in 的c值为df3 .

由于我正在使用 data.tables,因此“data.table-solution”会很好,可能类似于:

0 投票
3 回答
5322 浏览

r - 在 R 中使用 sqldf 包选择唯一行

我有一个 csv 文件,它有 190 万行和 32 列。我的 RAM 也有限,这使得它加载到内存中非常不方便。结果,我正在考虑使用数据库,但对该主题没有任何深入的了解,因此已经查看了该站点,但到目前为止还没有找到可行的解决方案。

CSV 文件如下所示:

.... .... 多达 190 万行

如您所见,“案例”列重复出现,但我只想在将其导入数据框之前获取唯一记录。所以我用了这个:

但是我收到此错误:

我在这里有什么明显的遗漏吗。非常感谢提前。

0 投票
2 回答
352 浏览

r - ggplot2饼图错误

我正在使用以下代码创建一个带有 ggplot2 的饼图,其中包含两个彼此相邻的饼图:一个用于“MotT”的每个值。每个饼图需要如何为每个“模型”分配比例。这是我的代码:

尝试运行 "df=sqldf("select..."

当然 p 是空的。我明白了

如果我尝试调用它。

任何帮助将不胜感激!谢谢

0 投票
1 回答
545 浏览

sql - SQLDF Left Join 仍然从表 A 中删除行

如果这里已经回答了这个问题,我深表歉意,但我找不到任何关于我的具体问题的信息。

我有年和月的时间序列,以及许多物种的生物量的时间序列数据。我需要为十五个特定物种分离出时间序列。不幸的是,如果在给定的月份没有遇到某个物种的个体,则没有输入任何数据,在我的时间序列中留下了应该是 0 的空白。为了解决这个问题,我试图将物种数据(右手表)左连接到一个完整的时间序列(左手表)上。不幸的是,我的输出连接仍然缺少没有数据的月份。例如,我错过了 1986 年第 1 个月,因为我的右侧表格中没有该月的数据。我认为左连接应该包括这些行,但将右侧的列留空。

我的代码如下。您可以提出任何建议将不胜感激。谢谢!

编辑

很抱歉回答我自己的问题,但我想出了如何去做,我想留下这个,以防其他人遇到同样的问题。问题在于 WHERE 参数限制了最终输出,而不仅仅是将右侧表送入连接。我使用的代码如下。

0 投票
1 回答
2388 浏览

sql - R语言sqldf包更新表不起作用

我将一些数据从 csv 文件导出到 R。我正在使用 sqldf 包更新数据。我的以下查询运行。我可以提供我的 csv 文件,但我不知道如何在此处附加文件:(

但是当我在查询下面运行时它不会运行:(这很有趣,因为除了更新表部分之外,其余查询是上述查询的一部分。

我的更新表命令有什么问题?当我在 sql development studio 中运行我的代码时,它运行良好……但如果代码在 R 中运行,我更喜欢

更新:

我需要对以下代码进行哪些更改????

0 投票
1 回答
35 浏览

r - 在广泛的数据框中组合行名,同时保持与特定行相关联的数据

我有一个包含啤酒名称及其评论的广泛数据框,每种啤酒都有多次重复,有人对我如何将它们组合以将每个评论集减少到一个啤酒名称列表及其总体评论的平均值有任何建议吗

IE

这是我迄今为止尝试过的

到目前为止,这段代码只会崩溃 r ^^^^

0 投票
0 回答
102 浏览

r - R中的规则测试

我有一组需要测试的规则。我正在使用 iris 数据集,生成的规则是这样的:

规则,等级

PetalLength > 2.45 AND PetalWidth <= 1.7,杂色 PetalWidth > 0.8 AND PetalLength <= 4.75,杂色

我现在想通过数据集传递每个规则,并获得一个数据框,其中我的行是数据集的记录,列是规则,当每个规则通过记录时,如果规则正确分类记录,它给出的分数为 1,否则该记录的分数为 0,并且这些值存储在每一行的数据框中。我希望在通过每条规则后取一个行总和,如果行总和超过某个值(比如 3),那么规则的通过就会停止。

到目前为止,我已经编写了一个通过数据集运行每个规则的代码,并给出了特定规则正确分类的实例数,但我不确定如何编写这方面的代码。有人可以帮我吗?

这段代码为我提供了一个数据框,其中每个规则都贯穿所有行,最后给出了列总和,即由该特定规则正确分类的实例数。