问题标签 [pandasql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
22218 浏览

python - 没有聚合函数的分组

我见过这样的pandasql查询:

这给出了:

我发现没有聚合函数的 group by 真的很奇怪,但是谁能告诉我聚合列上使用了哪个函数来将多个值减少为一个?

0 投票
2 回答
150 浏览

python - Python中带参数的文本更改

如果我想用参数更改查询。

我不想用这个 Query 运行 Sql 。我想在 txt 文件中编写查询并与其他人共享查询。

但是 Pandas.text_sql、Pandas.read_sql_query 这个函数会使用查询来运行。

所以我想找到与 pandas.read_sql_query 类似的参数的文本更改

我可以更改“read_sql_query”哪个函数?我真的对python有点了解..如果你知道的话,帮助我~

0 投票
1 回答
308 浏览

python - 如何将具有特定字段和 where 子句的 SQL 选择语句转换为 pandas 数据框

我正在尝试将休闲 SQL 语句转换为 python 中的 pandas 数据框

我无法在熊猫中得到这个

提前致谢

0 投票
0 回答
196 浏览

sql-server - 将带有熊猫的excel目录解析为带有文件名子字符串列的mssql

我有一个文件夹,其中的子文件夹堆放着 .xls 文件,我想将这些文件合并到一个大型 DataFrame 中并将其导出到 mssql 服务器。此外,文件名包含一个时间戳 ddmmmyyyy,我需要将其提取并连接到 df。

连接有效,并且根据我收集的循环运行,但没有新数据添加到 DataFrame 中。df.head()返回未更改的表。有人对我做错了什么有任何线索吗?

在运行 create_engine 语句时,我也会收到这个烦人的连接警告,尽管它不会影响任何东西:

SAWarning:未指定驱动程序名称;这是 PyODBC 在使用无 DSN 连接时所期望的“未指定驱动程序名称;

任何帮助表示赞赏!:)

0 投票
1 回答
1448 浏览

python - pandas 数值列被视为对象并且不会强制

我很难理解我的 sql 到 pandas 数据框数据类型的情况:

  • User_ID 应该是一个“对象”。这很好。
  • DATE的格式为201612、201701、201702等(年数+月数)
  • INCOME 是所有数值,例如 57.25、50、100.10 等
  • DEDUCTIONS 也是数字
  • COUNT of STORE 自然是一个整数......

我不明白为什么我的数据集以这些计数和总和字段作为对象返回,因为我不能使用诸如 df.total_deductions.max() 之类的操作。我无法理解可能导致此问题的原因或如何解决它。

我看了看数据。我似乎无法表明会导致这些计数或总和成为对象而不是数值。
我尝试使用 pd.to_numeric( each_of_my_columns, error ='coerce') 但这个强制选项强制它们为“NaN”。

有人可以假设这里会发生什么或如何解决这个问题,因为我假设我正在做一些应该明显不正确的事情吗?

0 投票
2 回答
13737 浏览

csv - 将 pandas 列转换为逗号分隔的列表以在 sql 语句中使用

我有一个数据框,我正在尝试将列转换为逗号分隔的列表。最终目标是将此逗号分隔的列表作为 SQL 查询中过滤项目的列表传递。

我该怎么做呢?

预期的解决方案 - 请注意 id 周围的引号,因为它们是字符串和标题为“b”的列中的项目,因为这是一个数字字段以及 SQL 的工作方式。然后我最终会发送一个查询

my_ids = '杰克','吉尔','七月'

my_values = 87,55,5555

0 投票
1 回答
1124 浏览

python - Error executing SQL command against pandas dataframe

I am following the Udacity data Science into course and my solution was exactly the one they provided

however it returns me this error:

Can you please help me figure out what's going wrong in my code? thanks in advance!

0 投票
1 回答
1018 浏览

python-3.x - 如何使用 Pandas 库将一个值与 Python 中的多个值进行比较?

目前,我有以下情况。

我有一个 Excel 文件和一组 SQL 结果,我想将Excel 文件中Sector 列的每个值与 SQL 结果中 Sector 列中的所有值进行比较,因此,如果值之间存在匹配然后将这两列中的列hourvalue_csvalue_ps从 SQL 结果添加到新的数据框中。注意: SQL 结果的数据与 Excel 文件的数据大小不同。

期望的结果

我遵循的方法是将 SQL 结果转换为数据框以及 Excel 文件中的数据,但我不知道如何在没有 for 循环的情况下执行比较,而只使用 Pandas(for 循环也需要很多时间来执行计算)。

所有的建议、评论将不胜感激,以帮助我完成这部分代码。

0 投票
1 回答
2238 浏览

sqlite - Pandas/iPython 笔记本(Jupyter)中 DataFrame/table 中的 GROUP BY 行?

我有一个看起来像这样的表:

当前数据帧/表:'original_table'

我可以使用 SQL 查询派生如下表吗?

基本上我期望一个表具有来自 col_1 的 DISTINCT 值,来自 col_2 的所有对应值和来自 col_3 的对应值的 SUM(col_3) 在一行中。

我的查询:

我尝试使用group_concat使用嵌入式 SQL 查询,但它给了我以下错误:

任何人都可以帮我做一个简单的黑客吗?

0 投票
0 回答
197 浏览

python - 为什么当我没有指定它返回时,pandasql 查询返回最大值

输出

在这一点上,我知道该表被分组为雾组,分为 2 个类别,但我不明白为什么 maxtempi 会获得这些值,因为我没有明确指定返回最高温度。