问题标签 [pandasql]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

209 问题

0 投票

1 回答

22218 浏览

python - 没有聚合函数的分组

我见过这样的pandasql查询：

这给出了：

我发现没有聚合函数的 group by 真的很奇怪，但是谁能告诉我聚合列上使用了哪个函数来将多个值减少为一个？

2017-03-20T10:47:29.600

0 投票

2 回答

150 浏览

python - Python中带参数的文本更改

如果我想用参数更改查询。

我不想用这个 Query 运行 Sql 。我想在 txt 文件中编写查询并与其他人共享查询。

但是 Pandas.text_sql、Pandas.read_sql_query 这个函数会使用查询来运行。

所以我想找到与 pandas.read_sql_query 类似的参数的文本更改

我可以更改“read_sql_query”哪个函数？我真的对python有点了解..如果你知道的话，帮助我~

python pandasql pandas-datareader

2017-03-28T06:40:28.763

0 投票

1 回答

308 浏览

python - 如何将具有特定字段和 where 子句的 SQL 选择语句转换为 pandas 数据框

我正在尝试将休闲 SQL 语句转换为 python 中的 pandas 数据框

我无法在熊猫中得到这个

提前致谢

python pandas machine-learning data-analysis pandasql

2017-04-06T18:47:25.720

0 投票

0 回答

196 浏览

sql-server - 将带有熊猫的excel目录解析为带有文件名子字符串列的mssql

我有一个文件夹，其中的子文件夹堆放着 .xls 文件，我想将这些文件合并到一个大型 DataFrame 中并将其导出到 mssql 服务器。此外，文件名包含一个时间戳 ddmmmyyyy，我需要将其提取并连接到 df。

连接有效，并且根据我收集的循环运行，但没有新数据添加到 DataFrame 中。df.head()返回未更改的表。有人对我做错了什么有任何线索吗？

在运行 create_engine 语句时，我也会收到这个烦人的连接警告，尽管它不会影响任何东西：

SAWarning：未指定驱动程序名称；这是 PyODBC 在使用无 DSN 连接时所期望的“未指定驱动程序名称；

任何帮助表示赞赏！:)

sql-server pandas pandasql

2017-05-11T12:32:18.480

0 投票

1 回答

1448 浏览

python - pandas 数值列被视为对象并且不会强制

我很难理解我的 sql 到 pandas 数据框数据类型的情况：

User_ID 应该是一个“对象”。这很好。
DATE的格式为201612、201701、201702等（年数+月数）
INCOME 是所有数值，例如 57.25、50、100.10 等
DEDUCTIONS 也是数字
COUNT of STORE 自然是一个整数......

我不明白为什么我的数据集以这些计数和总和字段作为对象返回，因为我不能使用诸如 df.total_deductions.max() 之类的操作。我无法理解可能导致此问题的原因或如何解决它。

我看了看数据。我似乎无法表明会导致这些计数或总和成为对象而不是数值。
我尝试使用 pd.to_numeric( each_of_my_columns, error ='coerce') 但这个强制选项强制它们为“NaN”。

有人可以假设这里会发生什么或如何解决这个问题，因为我假设我正在做一些应该明显不正确的事情吗？

python python-2.7 pandas type-conversion pandasql

2017-05-23T03:49:26.580

0 投票

2 回答

13737 浏览

csv - 将 pandas 列转换为逗号分隔的列表以在 sql 语句中使用

我有一个数据框，我正在尝试将列转换为逗号分隔的列表。最终目标是将此逗号分隔的列表作为 SQL 查询中过滤项目的列表传递。

我该怎么做呢？

预期的解决方案 - 请注意 id 周围的引号，因为它们是字符串和标题为“b”的列中的项目，因为这是一个数字字段以及 SQL 的工作方式。然后我最终会发送一个查询

my_ids = '杰克'，'吉尔'，'七月'

my_values = 87,55,5555

csv pandas dataframe pandasql

2017-05-24T22:01:48.313

0 投票

1 回答

1124 浏览

python - Error executing SQL command against pandas dataframe

I am following the Udacity data Science into course and my solution was exactly the one they provided

however it returns me this error:

Can you please help me figure out what's going wrong in my code? thanks in advance!

python pandas sqlite pandasql

2017-06-10T18:54:48.587

0 投票

1 回答

1018 浏览

python-3.x - 如何使用 Pandas 库将一个值与 Python 中的多个值进行比较？

目前，我有以下情况。

我有一个 Excel 文件和一组 SQL 结果，我想将Excel 文件中Sector 列的每个值与 SQL 结果中 Sector 列中的所有值进行比较，因此，如果值之间存在匹配然后将这两列中的列hour、value_cs和value_ps从 SQL 结果添加到新的数据框中。注意： SQL 结果的数据与 Excel 文件的数据大小不同。

期望的结果

我遵循的方法是将 SQL 结果转换为数据框以及 Excel 文件中的数据，但我不知道如何在没有 for 循环的情况下执行比较，而只使用 Pandas（for 循环也需要很多时间来执行计算）。

所有的建议、评论将不胜感激，以帮助我完成这部分代码。

python-3.x pandas pandasql

2017-07-24T18:11:23.827

0 投票

1 回答

2238 浏览

sqlite - Pandas/iPython 笔记本（Jupyter）中 DataFrame/table 中的 GROUP BY 行？

我有一个看起来像这样的表：

当前数据帧/表：'original_table'

我可以使用 SQL 查询派生如下表吗？

基本上我期望一个表具有来自 col_1 的 DISTINCT 值，来自 col_2 的所有对应值和来自 col_3 的对应值的 SUM(col_3) 在一行中。

我的查询：

我尝试使用group_concat使用嵌入式 SQL 查询，但它给了我以下错误：

任何人都可以帮我做一个简单的黑客吗？

sqlite pandas pyspark-sql pandas-groupby pandasql

2017-10-11T07:24:05.697

0 投票

0 回答

197 浏览

python - 为什么当我没有指定它返回时，pandasql 查询返回最大值

输出

在这一点上，我知道该表被分组为雾组，分为 2 个类别，但我不明白为什么 maxtempi 会获得这些值，因为我没有明确指定返回最高温度。

python mysql sql pandas pandasql

user8811684

2017-10-21T16:47:54.313

1 2 3 4 5 6 7 8 9 10

问题标签 [pandasql]

Reference