问题标签 [pandasql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1880 浏览

python - 使用 Flask 请求加载 Json 脚本,转换为 pandas 数据帧并返回 Json 作为 Flask 响应

我正在使用 Python/pickle 作为我的评分模型。要评分的数据将来自作为 Json 脚本的 Flask 请求。需要从 Flask 请求中读取数据,将数据转换为 pandas 数据帧,通过 pandasql 转换数据,调用评分模型并将评分结果数据帧输出为 Json 中的 Flask 响应。

  1. 当传入的数据是我硬盘上的 Json 文件时(使用 json.load()),我可以让上述所有内容正常工作。
  2. 对于调试,我可以使用 Flask 请求来加载 Json 脚本并将其转换为数据帧并将数据帧作为 Json 中的 Flask 响应返回。
  3. 但是,在通过 Flask 请求加载 Json 脚本后,我尝试使用pandasql转换数据,但得到错误数据帧未找到“异常:未找到 df”。
    • 我该如何解决这个问题?提前谢谢你(下面的代码和Json脚本)

根据上面的#2:此代码有效。

根据问题 #3:此代码不起作用!使用 pandasql 转换数据框得到错误:'df is not found'(底部的完整回溯)

完整的错误回溯:

json脚本:

0 投票
1 回答
257 浏览

python - 在python数据框中将相似的行合并为一行

我有一些如下的数据框,我想做的是将具有相同“yyyymmdd”和“hr”的行组合成一行。(有几行具有相同的 "yyyymmdd" 和 "hr" )

我想要的输出的一部分应该是这样的,例如:

请分享一些我可以在 python pandas 或 SQL 中使用的想法,谢谢!

==================================================== ========================

现在我还有 2 个问题要问:

  1. 如何“填充”数据框的“hr”索引?它假设应该是这样的:

    yyyymmdd hr ariel cat kiki mmax vicky gaolie shiu nick ck 0 2015-12-27 8 NaN NaN NaN NaN NaN NaN NaN NaN NaN 1 2015-12-27 9 0 0 0 0 0 0 0 23 0 2 2015-12-27 10 0 0 0 0 0 0 0 2 0 3 2015-12-27 11 0 0 0 0 0 0 0 20 0 4 2015-12-27 12 0 0 0 0 0 0 0 4 0 5 2015-12-27 13 NaN NaN NaN NaN NaN NaN NaN NaN NaN 6 2015-12-27 14 NaN NaN NaN NaN NaN NaN NaN NaN NaN 7 2015-12-27 15 NaN NaN NaN NaN NaN NaN NaN NaN NaN 8 2015-12-27 16 NaN NaN NaN NaN NaN NaN NaN NaN NaN 9 2015-12-27 17 0 0 0 0 0 0 0 2 0 10 2015-12-27 18 NaN NaN NaN NaN NaN NaN NaN NaN NaN 11 2015-12-27 19 1 0 0 0 0 0 0 0 0 12 2015-12-27 20 NaN NaN NaN NaN NaN NaN NaN NaN NaN 13 2015-12-28 8 0 8 0 0 0 0 0 0 0 14 2015-12-28 9 11 11 0 0 0 0 19 0 0 15 2015-12-28 10 85 13 0 0 2 0 15 0 0 16 2015-12-28 11 2 11 0 0 2 0 14 0 0 17 2015-12-28 12 2 20 0 4 0 0 10 0 0 18 2015-12-28 13 8 9 0 9 3 0 9 0 0 19 2015-12-28 14 4 10 0 8 0 0 22 0 0 20 2015-12-28 15 3 3 0 2 0 0 16 0 0 21 2015-12-28 16 14 5 1 1 0 0 19 0 0 22 2015-12-28 17 15 1 2 0 0 0 19 0 0 23 2015-12-28 18 0 0 0 6 0 0 0 0 0 24 2015-12-28 19 0 0 0 5 0 0 0 0 0 25 2015-12-28 20 0 0 0 1 0 0 0 0 0

  2. 如何根据列和 hr 绘制折线图?(x-axis = columns , ie : ariel ,cat, kiki...) (y-axis = hr, ie : 8,9,10...20 ) 每个图表代表一个数据 (ie 2015-12-27, 2015-12-28..)

谢谢!!

0 投票
1 回答
1152 浏览

python - 无法在 Python 2.7 中导入 Pandasql

我刚刚通过Anaconda安装了新版本的 Python 2.7.11并安装了 pandas 0.17.1 和 pandas 0.6.3。

每当我进入 python IDE 并输入:

或者

我收到以下消息:

一切似乎都依赖于这个 pandas.io.sql 模块。我尝试卸载 Pandas 并重新安装并使用 pip 而不是 Anaconda,但似乎没有任何效果。

关于如何成功导入 pandasql 的任何想法?

0 投票
1 回答
486 浏览

python-2.7 - 在 python2.7 中使用 pandas 从 csv 文件中读取最后一个索引

我在磁盘上有一个 .csv 文件,经过格式化,以便我可以轻松地将其读入 pandas DataFrame,我会定期向其中写入行。我需要这个数据库有一个行索引,所以每次我写一个新行时,我都需要知道最后一行的索引。

有很多方法可以做到这一点:

  • 我可以将整个文件读入 DataFrame,附加我的行,然后再次将整个 DataFrame 打印到内存中。随着数据库的增长,这可能会变得有点慢。
  • 我可以将整个索引列读入内存,然后选择最大值,然后将我的行附加到 .csv 文件中。这可能会好一些,具体取决于列读取的实现方式。

我很好奇是否有一种方法可以直接获取一个单元格,而无需将一大堆额外信息读入内存。有什么建议么?

0 投票
1 回答
87 浏览

python-2.7 - 无法在一个 python 文件中导入 sqldf,而它在另一个文件中工作。这两个文件位于不同的文件夹中。我该如何正确设置?

from pandasql import sqldf当我尝试它时,在一个 python 文件中。路径是

在另一个文件中,当我使用相同的命令时,它给了我错误

这个文件的路径是

我不明白为什么?当我写import sqldf提示时显示sqldf为自动完成选项。但不起作用。

0 投票
0 回答
290 浏览

python - 导入 pandasql 的语法错误

我刚刚安装了 pandasql 并不断收到使用指南中指定的错误导入。我似乎有点失落。我用 sudo 安装了这个包,因为我在 python 文件夹上也被拒绝了权限。会欣赏一些智慧:

0 投票
2 回答
2058 浏览

python - Pandasql:sqldf 执行错误

我想使用 pandasql 执行 sql-query "SELECT 1"。但是有一个错误:

这是代码(Python 3.4、pandasql 0.7.1、pandas 0.14.1):

请帮帮我!

0 投票
1 回答
5095 浏览

python - Pandas IO SQL 和具有多个结果集的存储过程

所以我在本地 sql 服务器上有一个存储过程,这会返回多个数据集/表

通常,在 python / pyodbc 我会使用

我希望使用 ps.io.sql.read_sql 并将具有多个结果集的存储过程返回到数据框中,但是我找不到任何引用如何移动光标并在关闭之前获取更多信息的内容。

0 投票
1 回答
1861 浏览

pandas - Integrating sql,pandas alongwith Bokeh

Here we are trying to load packages and then write an SQl query to integrate with Pandas and then finally using Bokeh to show the plot But bokeh is not showing anything.

You can consider the following as the dataset df_new_2:

The code starts here

0 投票
1 回答
2193 浏览

python - 如何使用索引在 pandasql 中加入两个 pandas 数据框?

我知道如何在 pandas 中以各种方式连接表 - concat、merge 等,但我也想知道如何使用 pandasql 来做到这一点。具体来说,我想在索引上加入两个熊猫数据框。这可能吗?当我做

我得到正确的结果。(我在两个表上都有一个“关键”变量。)但是,当我尝试

我明白了