问题标签 [pandasql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 没有聚合函数的分组
我见过这样的pandasql
查询:
这给出了:
我发现没有聚合函数的 group by 真的很奇怪,但是谁能告诉我聚合列上使用了哪个函数来将多个值减少为一个?
python - Python中带参数的文本更改
如果我想用参数更改查询。
我不想用这个 Query 运行 Sql 。我想在 txt 文件中编写查询并与其他人共享查询。
但是 Pandas.text_sql、Pandas.read_sql_query 这个函数会使用查询来运行。
所以我想找到与 pandas.read_sql_query 类似的参数的文本更改
我可以更改“read_sql_query”哪个函数?我真的对python有点了解..如果你知道的话,帮助我~
python - 如何将具有特定字段和 where 子句的 SQL 选择语句转换为 pandas 数据框
我正在尝试将休闲 SQL 语句转换为 python 中的 pandas 数据框
我无法在熊猫中得到这个
提前致谢
sql-server - 将带有熊猫的excel目录解析为带有文件名子字符串列的mssql
我有一个文件夹,其中的子文件夹堆放着 .xls 文件,我想将这些文件合并到一个大型 DataFrame 中并将其导出到 mssql 服务器。此外,文件名包含一个时间戳 ddmmmyyyy,我需要将其提取并连接到 df。
连接有效,并且根据我收集的循环运行,但没有新数据添加到 DataFrame 中。df.head()
返回未更改的表。有人对我做错了什么有任何线索吗?
在运行 create_engine 语句时,我也会收到这个烦人的连接警告,尽管它不会影响任何东西:
SAWarning:未指定驱动程序名称;这是 PyODBC 在使用无 DSN 连接时所期望的“未指定驱动程序名称;
任何帮助表示赞赏!:)
python - pandas 数值列被视为对象并且不会强制
我很难理解我的 sql 到 pandas 数据框数据类型的情况:
- User_ID 应该是一个“对象”。这很好。
- DATE的格式为201612、201701、201702等(年数+月数)
- INCOME 是所有数值,例如 57.25、50、100.10 等
- DEDUCTIONS 也是数字
- COUNT of STORE 自然是一个整数......
我不明白为什么我的数据集以这些计数和总和字段作为对象返回,因为我不能使用诸如 df.total_deductions.max() 之类的操作。我无法理解可能导致此问题的原因或如何解决它。
我看了看数据。我似乎无法表明会导致这些计数或总和成为对象而不是数值。
我尝试使用 pd.to_numeric( each_of_my_columns, error ='coerce') 但这个强制选项强制它们为“NaN”。
有人可以假设这里会发生什么或如何解决这个问题,因为我假设我正在做一些应该明显不正确的事情吗?
csv - 将 pandas 列转换为逗号分隔的列表以在 sql 语句中使用
我有一个数据框,我正在尝试将列转换为逗号分隔的列表。最终目标是将此逗号分隔的列表作为 SQL 查询中过滤项目的列表传递。
我该怎么做呢?
预期的解决方案 - 请注意 id 周围的引号,因为它们是字符串和标题为“b”的列中的项目,因为这是一个数字字段以及 SQL 的工作方式。然后我最终会发送一个查询
my_ids = '杰克','吉尔','七月'
my_values = 87,55,5555
python - Error executing SQL command against pandas dataframe
I am following the Udacity data Science into course and my solution was exactly the one they provided
however it returns me this error:
Can you please help me figure out what's going wrong in my code? thanks in advance!
python-3.x - 如何使用 Pandas 库将一个值与 Python 中的多个值进行比较?
目前,我有以下情况。
我有一个 Excel 文件和一组 SQL 结果,我想将Excel 文件中Sector 列的每个值与 SQL 结果中 Sector 列中的所有值进行比较,因此,如果值之间存在匹配然后将这两列中的列hour、value_cs和value_ps从 SQL 结果添加到新的数据框中。注意: SQL 结果的数据与 Excel 文件的数据大小不同。
期望的结果
我遵循的方法是将 SQL 结果转换为数据框以及 Excel 文件中的数据,但我不知道如何在没有 for 循环的情况下执行比较,而只使用 Pandas(for 循环也需要很多时间来执行计算)。
所有的建议、评论将不胜感激,以帮助我完成这部分代码。
sqlite - Pandas/iPython 笔记本(Jupyter)中 DataFrame/table 中的 GROUP BY 行?
我有一个看起来像这样的表:
当前数据帧/表:'original_table'
我可以使用 SQL 查询派生如下表吗?
基本上我期望一个表具有来自 col_1 的 DISTINCT 值,来自 col_2 的所有对应值和来自 col_3 的对应值的 SUM(col_3) 在一行中。
我的查询:
我尝试使用group_concat使用嵌入式 SQL 查询,但它给了我以下错误:
任何人都可以帮我做一个简单的黑客吗?
python - 为什么当我没有指定它返回时,pandasql 查询返回最大值
输出
在这一点上,我知道该表被分组为雾组,分为 2 个类别,但我不明白为什么 maxtempi 会获得这些值,因为我没有明确指定返回最高温度。