问题标签 [pandasql]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

209 问题

0 投票

0 回答

20 浏览

pandasql - cx_freeze - exe 在 sqldf 上返回无法描述的错误

尝试为我的脚本创建 exe，我正在使用 pandasql 和 sqldf 针对 2 个 csv 文件创建 sql 查询以进行匹配。构建后，当我运行 .exe 文件时，将根据提供的图像返回带有错误列表的屏幕。

您的帮助将不胜感激！

cx_Freeze：主脚本中的 Python 错误

pandasql

2018-10-11T08:17:47.630

0 投票

1 回答

654 浏览

python - 在列值上覆盖并附加熊猫数据框

我有一个基本数据框 df1：

在这里，我有一个带有更新 df2 的新数据框：

我想在列名上覆盖并附加这两个数据框。例如： a 和 b 存在于 df1 中，但也存在于具有更新计数值的 df2 中。所以我们用 a 和 b 的新计数来更新 df1。由于 f 和 g 在 df1 中不存在，所以我们附加它们。这是所需操作后的示例：

我尝试了 df.merge 或 pd.concat 但似乎没有任何东西可以提供我需要的输出。？任何一个都可以

python python-3.x pandas dataframe pandasql

2018-10-15T20:52:50.120

0 投票

0 回答

592 浏览

python - 与 python 2 相比，pandas.read_sql 在 python 3 内核上非常慢

我有一个简单的参数化选择查询，通过 pyodbc 连接访问 Oracle 数据库，并通过 pandas.read_sql 获取数据框中的数据。该代码在 Python 2 内核中非常高效和快速，而在 Python 3 中则非常慢。

以下是代码：

Python 2 执行时间：0.193000078201

Python 3 执行时间：53.687000036239624

python python-3.x python-2.7 pandas pandasql

2018-11-11T17:41:29.287

0 投票

1 回答

725 浏览

python - Pandasql 查询数据帧列表或字典

给定一组文件——每个文件都被读入不同的文件——查询dataframe如何pandasql引用它们？

在以下代码段中，我们有 a listof dataframes: 但同样的问题也适用于 a dict：

dfs[1]和dfs[2]正在显示我想做的事情- 但不是有效的语法。关于如何以可以支持的方式构建此类问题的任何建议pandasql？

python pandas pandasql

2018-11-17T18:25:30.160

0 投票

1 回答

137 浏览

sql - pandasql：计算对的出现次数

我试图计算 A 和 B 曾经参加过的比赛的数量，数据集如下所示：

这是数据在 Notebook 中的样子

所以 team1 和 team 29 的比赛次数是 2，因为它们曾经是 HomeTeam 和 AwayTeam，但是，使用我的查询我只能算作一次：

我知道我的问题在哪里，但不知道如何解决。

sql sqldf pandasql

2018-11-23T20:45:05.917

0 投票

1 回答

1404 浏览

python - pandasql OperationalError：SQL 变量太多

我正在尝试使用，pandasql但有些东西无法正常工作。我执行以下代码：

并得到这个错误：

和

可能是什么问题呢？

python pandas pandasql

2018-12-06T08:17:30.907

0 投票

1 回答

33 浏览

pandas - Pandas - 如何进行分组，其中新列是（一列的总和）/（分组的数量）的结果？

我需要进行某种分组，其中新列（结果）是值列的总和除以找到的项目数？有人可以帮我吗？

例如：

表 A

正确结果：

表 B

代码：

pandas pandas-groupby sklearn-pandas pandasql

2019-01-12T10:34:13.583

0 投票

1 回答

1160 浏览

python - 更新表语句在 pandasql 中不起作用

我有一个包含一些空值的数据集，我想更新以读取缺失而不是空值

我浏览了所有论坛和文档，但似乎找不到回应

我很遗憾地得到了这个错误日志

我期望将所有空值更改为“缺失”，但是代码将不会执行

发生的是一条错误消息，指出我要更新的表不存在 - 尽管该表确实拼写正确。

python pandas numpy pandasql

2019-01-19T18:58:48.050

0 投票

1 回答

19 浏览

python - 用于 PSQL 查询的变量

我的代码 python 有问题，我使用的是 Pandasql，我想要的是在查询中使用我的 (enddate)，所以：

enddate = pd.to_datetime(datetime.today()).date()

q2 = """SELECT * FROM res_q1 t1 where t1.JOURS = (enddate) """ res_q2 = psql.sqldf(q2, locals())

你能帮我吗？

python pandasql

2019-02-11T20:41:02.173

0 投票

0 回答

349 浏览

python - SQL 查询列不存在

我已经看到很多关于类似 SQL 查询的答案，但由于某种原因，没有一个解决方案适用于我的查询。我正在尝试将我的查询读入将它们与我之前的（列表）变量匹配的熊猫数据框中。谢谢你的任何建议

我得到一个列不存在错误，我不明白如何解决它了。感谢您的任何帮助

在评论中的建议之后，我尝试将查询更改为：

这样我在 LIKE 之后得到一个语法错误基因名和位置变量是列表，基本上我试图通过 python 访问 PostgreSQL 数据库（使用 psycopg），但由于我无法解决错误，现在我正在尝试使用 pandas.read_sql 函数。

我对SQL的经验很少，所以我真的很感谢所有的建议和更正

python sql pandasql

2019-02-16T12:04:25.243

1 2 3 4 5 6 7 8 9 10