问题标签 [pandasql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
20 浏览

pandasql - cx_freeze - exe 在 sqldf 上返回无法描述的错误

尝试为我的脚本创建 exe,我正在使用 pandasql 和 sqldf 针对 2 个 csv 文件创建 sql 查询以进行匹配。构建后,当我运行 .exe 文件时,将根据提供的图像返回带有错误列表的屏幕。

您的帮助将不胜感激!

cx_Freeze:主脚本中的 Python 错误

0 投票
1 回答
654 浏览

python - 在列值上覆盖并附加熊猫数据框

我有一个基本数据框 df1:

在这里,我有一个带有更新 df2 的新数据框:

我想在列名上覆盖并附加这两个数据框。例如: a 和 b 存在于 df1 中,但也存在于具有更新计数值的 df2 中。所以我们用 a 和 b 的新计数来更新 df1。由于 f 和 g 在 df1 中不存在,所以我们附加它们。这是所需操作后的示例:

我尝试了 df.merge 或 pd.concat 但似乎没有任何东西可以提供我需要的输出。?任何一个都可以

0 投票
0 回答
592 浏览

python - 与 python 2 相比,pandas.read_sql 在 python 3 内核上非常慢

我有一个简单的参数化选择查询,通过 pyodbc 连接访问 Oracle 数据库,并通过 pandas.read_sql 获取数据框中的数据。该代码在 Python 2 内核中非常高效和快速,而在 Python 3 中则非常慢。

以下是代码:

Python 2 执行时间:0.193000078201

Python 3 执行时间:53.687000036239624

0 投票
1 回答
725 浏览

python - Pandasql 查询数据帧列表或字典

给定一组文件——每个文件都被读入不同的文件——查询dataframe如何pandasql引用它们?

在以下代码段中,我们有 a listof dataframes: 但同样的问题也适用于 a dict

dfs[1]dfs[2]正在显示我想做事情- 但不是有效的语法。关于如何以可以支持的方式构建此类问题的任何建议pandasql

0 投票
1 回答
137 浏览

sql - pandasql:计算对的出现次数

我试图计算 A 和 B 曾经参加过的比赛的数量,数据集如下所示:

这是数据在 Notebook 中的样子

所以 team1 和 team 29 的比赛次数是 2,因为它们曾经是 HomeTeam 和 AwayTeam,但是,使用我的查询我只能算作一次:

我知道我的问题在哪里,但不知道如何解决。

0 投票
1 回答
1404 浏览

python - pandasql OperationalError:SQL 变量太多

我正在尝试使用,pandasql但有些东西无法正常工作。我执行以下代码:

并得到这个错误:

可能是什么问题呢?

0 投票
1 回答
33 浏览

pandas - Pandas - 如何进行分组,其中新列是(一列的总和)/(分组的数量)的结果?

我需要进行某种分组,其中新列(结果)是值列的总和除以找到的项目数?有人可以帮我吗?

例如:

表 A

正确结果:

表 B

代码:

0 投票
1 回答
1160 浏览

python - 更新表语句在 pandasql 中不起作用

我有一个包含一些空值的数据集,我想更新以读取缺失而不是空值

我浏览了所有论坛和文档,但似乎找不到回应

我很遗憾地得到了这个错误日志

我期望将所有空值更改为“缺失”,但是代码将不会执行

发生的是一条错误消息,指出我要更新的表不存在 - 尽管该表确实拼写正确。

0 投票
1 回答
19 浏览

python - 用于 PSQL 查询的变量

我的代码 python 有问题,我使用的是 Pandasql,我想要的是在查询中使用我的 (enddate),所以:

enddate = pd.to_datetime(datetime.today()).date()

q2 = """SELECT * FROM res_q1 t1 where t1.JOURS = (enddate) """ res_q2 = psql.sqldf(q2, locals())

你能帮我吗?

0 投票
0 回答
349 浏览

python - SQL 查询列不存在

我已经看到很多关于类似 SQL 查询的答案,但由于某种原因,没有一个解决方案适用于我的查询。我正在尝试将我的查询读入将它们与我之前的(列表)变量匹配的熊猫数据框中。谢谢你的任何建议

我得到一个列不存在错误,我不明白如何解决它了。感谢您的任何帮助

在评论中的建议之后,我尝试将查询更改为:

这样我在 LIKE 之后得到一个语法错误 基因名和位置变量是列表,基本上我试图通过 python 访问 PostgreSQL 数据库(使用 psycopg),但由于我无法解决错误,现在我正在尝试使用 pandas.read_sql 函数。

我对SQL的经验很少,所以我真的很感谢所有的建议和更正