问题标签 [pandasql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pandasql - cx_freeze - exe 在 sqldf 上返回无法描述的错误
尝试为我的脚本创建 exe,我正在使用 pandasql 和 sqldf 针对 2 个 csv 文件创建 sql 查询以进行匹配。构建后,当我运行 .exe 文件时,将根据提供的图像返回带有错误列表的屏幕。
您的帮助将不胜感激!
python - 在列值上覆盖并附加熊猫数据框
我有一个基本数据框 df1:
在这里,我有一个带有更新 df2 的新数据框:
我想在列名上覆盖并附加这两个数据框。例如: a 和 b 存在于 df1 中,但也存在于具有更新计数值的 df2 中。所以我们用 a 和 b 的新计数来更新 df1。由于 f 和 g 在 df1 中不存在,所以我们附加它们。这是所需操作后的示例:
我尝试了 df.merge 或 pd.concat 但似乎没有任何东西可以提供我需要的输出。?任何一个都可以
python - 与 python 2 相比,pandas.read_sql 在 python 3 内核上非常慢
我有一个简单的参数化选择查询,通过 pyodbc 连接访问 Oracle 数据库,并通过 pandas.read_sql 获取数据框中的数据。该代码在 Python 2 内核中非常高效和快速,而在 Python 3 中则非常慢。
以下是代码:
Python 2 执行时间:0.193000078201
Python 3 执行时间:53.687000036239624
python - Pandasql 查询数据帧列表或字典
给定一组文件——每个文件都被读入不同的文件——查询dataframe
如何pandasql
引用它们?
在以下代码段中,我们有 a list
of dataframes
: 但同样的问题也适用于 a dict
:
dfs[1]
和dfs[2]
正在显示我想做的事情- 但不是有效的语法。关于如何以可以支持的方式构建此类问题的任何建议pandasql
?
sql - pandasql:计算对的出现次数
我试图计算 A 和 B 曾经参加过的比赛的数量,数据集如下所示:
所以 team1 和 team 29 的比赛次数是 2,因为它们曾经是 HomeTeam 和 AwayTeam,但是,使用我的查询我只能算作一次:
我知道我的问题在哪里,但不知道如何解决。
python - pandasql OperationalError:SQL 变量太多
我正在尝试使用,pandasql
但有些东西无法正常工作。我执行以下代码:
并得到这个错误:
和
可能是什么问题呢?
pandas - Pandas - 如何进行分组,其中新列是(一列的总和)/(分组的数量)的结果?
我需要进行某种分组,其中新列(结果)是值列的总和除以找到的项目数?有人可以帮我吗?
例如:
表 A
正确结果:
表 B
代码:
python - 更新表语句在 pandasql 中不起作用
我有一个包含一些空值的数据集,我想更新以读取缺失而不是空值
我浏览了所有论坛和文档,但似乎找不到回应
我很遗憾地得到了这个错误日志
我期望将所有空值更改为“缺失”,但是代码将不会执行
发生的是一条错误消息,指出我要更新的表不存在 - 尽管该表确实拼写正确。
python - 用于 PSQL 查询的变量
我的代码 python 有问题,我使用的是 Pandasql,我想要的是在查询中使用我的 (enddate),所以:
enddate = pd.to_datetime(datetime.today()).date()
q2 = """SELECT * FROM res_q1 t1 where t1.JOURS = (enddate) """ res_q2 = psql.sqldf(q2, locals())
你能帮我吗?
python - SQL 查询列不存在
我已经看到很多关于类似 SQL 查询的答案,但由于某种原因,没有一个解决方案适用于我的查询。我正在尝试将我的查询读入将它们与我之前的(列表)变量匹配的熊猫数据框中。谢谢你的任何建议
我得到一个列不存在错误,我不明白如何解决它了。感谢您的任何帮助
在评论中的建议之后,我尝试将查询更改为:
这样我在 LIKE 之后得到一个语法错误 基因名和位置变量是列表,基本上我试图通过 python 访问 PostgreSQL 数据库(使用 psycopg),但由于我无法解决错误,现在我正在尝试使用 pandas.read_sql 函数。
我对SQL的经验很少,所以我真的很感谢所有的建议和更正