问题标签 [pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 检查 HDF5 Store 对象是否为空?
我正在使用 pandas HDFSTore 对象打开 hdf5 文件并存储DataFrame
对象。但在我这样做之前,我想知道文件是否为空。有没有办法找出我的
有没有办法在 store.h5 中浏览层次结构树以检查对象是否为空。我想获取 store.h5 中的对象列表
python - 熊猫在一定级别上洗牌
我有一个在行上DataFrame
使用 a的熊猫:MultiIndex
我想在索引的第一级对这个 DataFrame 进行洗牌,所以可能的结果是:
python - Pandas 无法导入 IPython
我在跑步Windows 7.0
,带着Python2.7
。我在安装之前安装了熊猫ipython0.12.1
(稳定)。
当我运行import pandas
时,IPython.exe
我收到错误消息:
没有名为 pandas 的模块
如果我通过 cmd 从开始菜单调用 IPython,它不会自动在C:\Python27
pandas 所在的位置运行。相反,它以不同的路径运行C:\Users\mycomputername\\.ipython
。(ipython 无法检测到机器上存在 pandas 库似乎是不合理的)。
话虽这么说,我还 cd 进入C:\Python27\dist\ipython-0.12
文件夹以从那里运行,ipython.exe
其中安装了相应的库。distribute-0.6.26
pyreadline-1.7.1
我仍然收到该错误消息。有谁知道安装顺序是否在 Windows7 上是特定的?
python - 重新定义 Pandas DataFrame 对象中的索引
我正在尝试重新索引熊猫DataFrame
对象,就像这样,
我正在解决这个问题,如下所示并且得到了错误的答案。关于如何做到这一点的任何线索?
知道为什么会这样吗?
python - Pandas:如何将年度数据相互叠加
我有一系列按时间值(浮点数)索引的数据,我想获取该系列的大部分并将它们绘制在彼此之上。例如,假设我在 20 周内大约每 10 分钟获取一次股票价格,我想通过绘制 20 条股票价格线来查看每周模式。所以我的 X 轴是一周,我有 20 条线(对应于一周内的价格)。
更新
索引不是均匀间隔的值,它是一个浮点数。它是这样的:
所以索引不是均匀分布的。我正在处理来自模拟器的电压与时间数据。我想知道如何创建一个时间窗口 T,并将 df 拆分为 T 长的块并将它们绘制在彼此之上。因此,如果数据长度为 20*T,那么我将在同一个图中有 20 条线。
对困惑感到抱歉; 我使用股票类比认为它可能会有所帮助。
python - Interpolation on DataFrame in pandas
I have a DataFrame, say a volatility surface with index as time and column as strike. How do I do two dimensional interpolation? I can reindex
but how do i deal with NaN
? I know we can fillna(method='pad')
but it is not even linear interpolation. Is there a way we can plug in our own method to do interpolation?
python - 计算 Series 或 DataFrame 的交叉(截取)点
我有索引是浮点数的周期性数据,如下所示:
我想创建一个cross(df, y_val, direction='rise' | 'fall' | 'cross')
函数,该函数返回一个时间数组(索引),其中包含电压值等于y_val的所有插值点。对于“上升”,仅返回斜率为正的值;对于“下降”,仅返回具有负斜率的值;对于'cross'两者都返回。因此,如果y_val=0和direction='cross'则将返回一个包含 10 个值的数组,其中包含交叉点的 X 值(第一个值约为 0.025)。
我在想这可以用迭代器来完成,但想知道是否有更好的方法来做到这一点。
谢谢。我爱熊猫和熊猫社区。
python - 熊猫阅读 csv 方向
嘿,我正在尝试在 pandas 中读取您可以从此处下载的 csv 文件(euribor 利率我想您可以想象我想要这个文件的原因!)。该文件是一个 CSV 文件,但它的方向有些奇怪。如果您将其导入 Excel 文件,则格式为
让第一列达到 12m(但我已经给了你可以下载示例的链接)。我想在熊猫中阅读它,但我无法以正确的方式阅读它。Pandas 有一个用于读取 csv 文件的内置函数,但不知何故它希望是面向行而不是面向列的。我想要做的是获取标记为 3m 的行的信息,并具有值和日期,以便绘制该索引的时间变化。但我无法处理这个问题。我知道我可以读取数据
但如果 csv 文件会以某种方式转置,它会起作用。H
python - Series.interpolate 中可能存在的错误
我正在尝试在多个DataFrame
s 或 Series 之间对齐我的索引值,并且我正在使用 Series.interpolate 但它似乎没有正确插值。或者我可能误解了什么。这是一个小例子:
我希望 sig1 和 sig2 比 df1 和 df2 有更多的点,但值是插值的。有几个点不重叠。这是错误还是用户错误?我正在使用 v0.7.3
谢谢。
python - 在 Ipython notebook / Jupyter 中,Pandas 没有显示我尝试绘制的图表
我正在尝试在 Ipython Notebook 中使用 pandas 绘制一些数据,虽然它给了我对象,但它实际上并没有绘制图形本身。所以它看起来像这样:
该图应该在此之后出现,但它根本不会出现。我已经导入了 matplotlib,所以这不是问题。我还需要导入其他模块吗?