问题标签 [pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2763 浏览

python - 检查 HDF5 Store 对象是否为空?

我正在使用 pandas HDFSTore 对象打开 hdf5 文件并存储DataFrame对象。但在我这样做之前,我想知道文件是否为空。有没有办法找出我的

有没有办法在 store.h5 中浏览层次结构树以检查对象是否为空。我想获取 store.h5 中的对象列表

0 投票
3 回答
2935 浏览

python - 熊猫在一定级别上洗牌

我有一个在行上DataFrame使用 a的熊猫:MultiIndex

我想在索引的第一级对这个 DataFrame 进行洗牌,所以可能的结果是:

0 投票
2 回答
6532 浏览

python - Pandas 无法导入 IPython

我在跑步Windows 7.0,带着Python2.7。我在安装之前安装了熊猫ipython0.12.1(稳定)。

当我运行import pandas时,IPython.exe我收到错误消息:

没有名为 pandas 的模块

如果我通过 cmd 从开始菜单调用 IPython,它不会自动在C:\Python27pandas 所在的位置运行。相反,它以不同的路径运行C:\Users\mycomputername\\.ipython。(ipython 无法检测到机器上存在 pandas 库似乎是不合理的)。

话虽这么说,我还 cd 进入C:\Python27\dist\ipython-0.12文件夹以从那里运行,ipython.exe其中安装了相应的库。distribute-0.6.26pyreadline-1.7.1

我仍然收到该错误消息。有谁知道安装顺序是否在 Windows7 上是特定的?

0 投票
3 回答
136930 浏览

python - 重新定义 Pandas DataFrame 对象中的索引

我正在尝试重新索引熊猫DataFrame对象,就像这样,

我正在解决这个问题,如下所示并且得到了错误的答案。关于如何做到这一点的任何线索?

知道为什么会这样吗?

0 投票
2 回答
3468 浏览

python - Pandas:如何将年度数据相互叠加

我有一系列按时间值(浮点数)索引的数据,我想获取该系列的大部分并将它们绘制在彼此之上。例如,假设我在 20 周内大约每 10 分钟获取一次股票价格,我想通过绘制 20 条股票价格线来查看每周模式。所以我的 X 轴是一周,我有 20 条线(对应于一周内的价格)。

更新

索引不是均匀间隔的值,它是一个浮点数。它是这样的:

所以索引不是均匀分布的。我正在处理来自模拟器的电压与时间数据。我想知道如何创建一个时间窗口 T,并将 df 拆分为 T 长的块并将它们绘制在彼此之上。因此,如果数据长度为 20*T,那么我将在同一个图中有 20 条线。

对困惑感到抱歉; 我使用股票类比认为它可能会有所帮助。

0 投票
2 回答
28988 浏览

python - Interpolation on DataFrame in pandas

I have a DataFrame, say a volatility surface with index as time and column as strike. How do I do two dimensional interpolation? I can reindex but how do i deal with NaN? I know we can fillna(method='pad') but it is not even linear interpolation. Is there a way we can plug in our own method to do interpolation?

0 投票
1 回答
4257 浏览

python - 计算 Series 或 DataFrame 的交叉(截取)点

我有索引是浮点数的周期性数据,如下所示:

我想创建一个cross(df, y_val, direction='rise' | 'fall' | 'cross')函数,该函数返回一个时间数组(索引),其中包含电压值等于y_val的所有插值点。对于“上升”,仅返回斜率为正的值;对于“下降”,仅返回具有负斜率的值;对于'cross'两者都返回。因此,如果y_val=0direction='cross'则将返回一个包含 10 个值的数组,其中包含交叉点的 X 值(第一个值约为 0.025)。

我在想这可以用迭代器来完成,但想知道是否有更好的方法来做到这一点。

谢谢。我爱熊猫和熊猫社区。

0 投票
2 回答
20785 浏览

python - 熊猫阅读 csv 方向

嘿,我正在尝试在 pandas 中读取您可以从此处下载的 csv 文件(euribor 利率我想您可以想象我想要这个文件的原因!)。该文件是一个 CSV 文件,但它的方向有些奇怪。如果您将其导入 Excel 文件,则格式为

让第一列达到 12m(但我已经给了你可以下载示例的链接)。我想在熊猫中阅读它,但我无法以正确的方式阅读它。Pandas 有一个用于读取 csv 文件的内置函数,但不知何故它希望是面向行而不是面向列的。我想要做的是获取标记为 3m 的行的信息,并具有值和日期,以便绘制该索引的时间变化。但我无法处理这个问题。我知道我可以读取数据

但如果 csv 文件会以某种方式转置,它会起作用。H

0 投票
2 回答
210 浏览

python - Series.interpolate 中可能存在的错误

我正在尝试在多个DataFrames 或 Series 之间对齐我的索引值,并且我正在使用 Series.interpolate 但它似乎没有正确插值。或者我可能误解了什么。这是一个小例子:

我希望 sig1 和 sig2 比 df1 和 df2 有更多的点,但值是插值的。有几个点不重叠。这是错误还是用户错误?我正在使用 v0.7.3

谢谢。

0 投票
7 回答
83830 浏览

python - 在 Ipython notebook / Jupyter 中,Pandas 没有显示我尝试绘制的图表

我正在尝试在 Ipython Notebook 中使用 pandas 绘制一些数据,虽然它给了我对象,但它实际上并没有绘制图形本身。所以它看起来像这样:

该图应该在此之后出现,但它根本不会出现。我已经导入了 matplotlib,所以这不是问题。我还需要导入其他模块吗?