问题标签 [pandasql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 简单的 pandasql 连接失败
我试图理解为什么以下失败pandasql
:
这会返回None
,但我希望它会返回类似
SQLite 连接是否存在我不理解的限制,或者这是一个问题pandasql
?我已经在 Access 中尝试过这个例子,它在那里工作得很好,但也许有一种更便携的方法可以用 SQL(很可能)或一种简单的方法来做到这一点pandas
?
嗯 - 即使是更简单的连接
失败。肯定是一头雾水。
编辑:鉴于@ari 的建议,我用我的真实数据(几百万行)尝试了这个,发现对于我的实际示例来说,它的速度要快得多
比做
从上表name_map
创建的地图在哪里。types
两者都比 SQL 查询快得多,所以我可能应该强调一下,但我仍然想知道它为什么不起作用。
python - 熊猫加速适用于 max()
我想知道如何加快以下功能,例如使用 Cython?
此函数按单列分组并返回每个组的目标达到其最大值的所有行;返回结果数据框。
如果 df 有 500K 行,上述函数在我的计算机上大约需要 5 分钟才能完成。这个性能还可以,但是我有超过 1000 万行的数据......当然,一种解决方案是在 SQL 服务器中将上述内容作为查询执行并让 Python 检索结果,但我希望有一个 SQL-免费的 Pythonic 解决方案。
python - 在 Python 中插入缺失值
全部 - 我希望你能提供帮助,因为这是我知道我几乎从这里和在线的各种帖子中破解的任务之一,但还没有完全发挥作用。
本质上,我在通过 psql.read_sql(sql, cnxn) 返回到 Pandas 对象的数据库中有以下数据
我只想对上述数据进行逐分钟插值。
我还以分钟的频率创建了一个日期时间序列,但在我的一生中,我无法将我的表“映射”到这个上,然后插值或者我如何将 StartTime 重新采样到分钟粒度,然后插值丢失的数据.
任何帮助将不胜感激(我确信当我找到解决方案时我会踢自己!) - 非常感谢
更新
按照下面的建议,代码如下:
提示时 new_df 的输出是:
python - 使用 pandas 将唯一数字转换为 md5 哈希
大家早上好。
我想将我的社会安全号码转换为 md5 哈希十六进制数。结果应该是每个社会安全号码的唯一 md5 哈希十六进制数。
我的数据格式如下:
我已经尝试使用以下代码hashlib
:
这给了我一个错误,它必须是一个字符串而不是一个列表。所以我尝试了以下方法:
这与我需要的非常接近,但无论社会保险号是否不同,所有十六进制数字都相同。我正在尝试为每个社会安全号码获取一个具有唯一十六进制数字的十六进制数字。
有什么建议么?
python - 在 python pandas 中将日期时间字段格式化为 MON-YYYY 并忽略空值
我有一个 python pandas 数据框“df”,如下所示 -
vendor_created_date
格式为datetime64[ns]
.
现在我想创建一个新字段,称为字段值应该在格式中的fomatted_date
位置,并且我想删除日期字段中的行。vendor_created_date
MON-YYYY
NaT
你能给我指路吗?
pandas - 在 PandaSQL 中使用用户输入变量
我正在尝试在我拥有的数据帧上使用 pandaSQL,我想知道是否有使用变量的方法或者是否有另一种方法。我要做的是将用户输入设置为变量,然后尝试在 SQL 语句中使用它。我想在输入时显示形状的每个实例。我正在尝试以下内容:
但到目前为止还没有运气。其他一切都很好,我只是在引入变量时遇到了麻烦。这在 pandaSQL 中是否可行,如果没有,我可以使用哪些解决方法?
python - pandasql 不会导入:ImportError: cannot import name to_sql
我在 linux 命令提示符下使用 pip 安装了 pandasql,并启动了 ipython notebook:
然后尝试在 ipython notebook 中导入 pandas 和它:
..它不高兴,环顾四周,但似乎没有任何地方有答案。这是它给出的错误消息:
有没有人有任何想法?干杯
python - 从列表中打印值(DataFrame 的真值是模棱两可的错误)
有一个问题。我有一个记录列表,还有另一个记录列表,我正在比较第一个列表。当我写行时(第一个列表的行内读取:
我得到结果
其中 11763 是 output_merged_stock 的 ID 号,而 Whs 是 PN_stripped 匹配的 whs 的名称。
但我无法提取数据以进行进一步处理。我只想写简单的 if 语句,我可以在其中询问 if whs = VLN
。我写:
我收到错误:The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我写:
我又得到了:The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
如果我想得到结果'VLN',我应该如何写 if 语句?例如,有时库存输出有时为 3 whs,其中 2 个是“VLN”,第三个是“XRS”,在这种情况下,我应该看到“如果”输出是没有 XRS 的 2 倍 VLN
python - 在python pandas中将朱利安日期列转换为公历
我在熊猫中有一堆“朱利安日期”类型的列。将它们转换为公历日期的最佳方法是什么。我的数据框看起来像 -
我想将 START_DATE 和 END_DATE 列转换为公历/常规日期时间。
在 sql 中,我会使用下面的 -
请建议。谢谢。
python - Python Pandas to_sql 在写入表时删除所有表索引
我有以下代码读取从左连接许多表形成的 MYSQL 选择命令。然后我想将结果写入另一个表。但是,当我这样做时(使用 Pandas),它可以正常工作并将数据添加到表中,但它会以某种方式破坏表中的所有索引,包括主键。
这是代码:
有任何想法吗?
编辑:
看来,通过使用 if_exists='replace',Pandas 会删除表并重新创建它,当它重新创建它时,它不会重建索引。
此外,这个问题:to_sql pandas method changes the scheme of sqlite tables 表明,通过使用 sqlalchemy 引擎,它可能会解决问题。
编辑:
当我使用 if_exists="append" 时,问题不会出现,只有 if_exists="replace" 才会出现问题。