问题标签 [pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何重新采样具有应用于每列的不同函数的数据框?
我有一个熊猫的温度和辐射时间序列dataframe
。时间分辨率为 1 分钟,以常规步长为单位。
如何将其下采样dataframe
到一小时的分辨率,计算温度的每小时平均值和辐射的每小时总和?
python - 在 Windows 上使用 Python 2.5 安装 Pandas
我正在尝试在运行 Windows XP 的机器上安装带有 Python 2.5 的 Pandas。
安装似乎可以完成,但是当我尝试时
我收到以下错误:
据我所知,我已经正确安装了所有依赖项,问题与functools.py
Python 标准库(?)的一部分有关。
请问有人有什么建议吗?Pandas 应该适用于 Python 2.5,所以我认为这是我的 Python 配置的问题。
python - python-pandas 和 mysql 等数据库
Pandas 的文档中有大量关于处理以各种格式存储的数据的最佳实践示例。
但是,我找不到任何使用 MySQL 等数据库的好例子。
谁能指出我的链接或提供一些代码片段,说明如何使用mysql-python有效地将查询结果转换为 Pandas 中的数据帧?
pandas - 熊猫:简单的“加入”不起作用?
我喜欢认为我不是白痴,但也许我错了。谁能向我解释为什么这不起作用?我可以使用“合并”来达到预期的效果。但我最终需要加入多个pandas
DataFrames
,所以我需要让这个方法起作用。
python - 插入新值的最佳方法
我想使用 pandas 数据框来跟踪我将在交易日实时下载的一些市场数据。
假设我想记录 AAPL 和 GOOG 的价格。我首先创建一个数据框:
假设第一个数据点在时间 t1 进入,AAPL 的价格为 555.0。然后几秒钟后,在 t2,GOOG 的价格为 430.0。
一个当然不能做:
除了拉索引、修改索引、重新索引数据框然后插入每个标量价格之外,pandas 中是否有一种简单/快速的方法来完成此操作?
python - 具有非唯一数据的 Pandas 数组中的多索引
我有以下数据框
我的问题是,考虑到数据不是唯一的,我如何以将(Z,A)作为索引(或 MultiIndexes)的 MultiIndex 的方式对数据进行分组/转换?为了明确我的目标,这是我期望实现的:
我知道这至少涉及两个步骤,一个用于唯一性,一个用于 Z,A 中的索引,因此对其中一个步骤的任何帮助表示赞赏,此外,是否有一些数据结构可能更适合这个问题?
编辑:我发现该行:
data=data.set_index(('Z','A'))
解决了 Z,A 中的索引问题。不幸的是,这只适用于 (Z,A) 对是唯一的。
python - Pandas:按直方图结果索引数据
我正在尝试按概率(用简单的直方图估计)来索引数据。目标是在系列中选择概率小于某个阈值的项目。
我有一系列整数值,例如:
然后我像这样计算他们的直方图:
所以现在我有了结果索引的每个结果的频率,以及一系列结果。我现在有两个问题:
- 有没有办法
series
通过定义的结果/频率的映射来索引freq
? - 如果我设法做到这一点,我如何只选择频率大于某个值的结果?
谢谢。
python - 熊猫:难以理解合并的工作原理
我在合并时做错了,我不明白它是什么。我已经完成了以下操作来估计一系列整数值的直方图:
如果我打印hist
,freq
这就是我得到的:
它们都被索引"series"
但如果我尝试合并:
我得到一个KeyError: 'no item named series'
例外。如果我省略on = "series"
我会得到一个IndexError: list index out of range
例外。
我不明白我做错了什么。可能“系列”是索引而不是列,所以我必须以不同的方式做?
python - 如何用熊猫创建高低开收盘图表
我有一个数据集,如下所示,我可以从文件流式传输到 python。我想使用 pandas 为每分钟创建一个 HLOC 数据图表,使用 asof 方法从时间零开始为 9:46....我还想知道如何将数据流式传输到 pandas 数据帧作为更新。这可能吗?
python - 导入 Confusion Pandas
今天之前我有 0.71 只熊猫。我试图更新,我只是运行了网站提供的 .exe 文件。
现在我尝试了“import pandas”,但它给了我一个错误
ImportError: C extensions not built: 如果您已经安装,请确认您没有从源目录导入。
一般来说,我是 python 和 pandas 的新手。任何事情都会有所帮助。
谢谢,