问题标签 [pandas-timeindex]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
241 浏览

python - Pandas 滚动时间窗口因字符串计数而失败 - 为什么?

尝试使用带有 timeindex 和 count() 方法的 pandas 滚动,出现错误,我在这里缺少什么?

这是一个例子:

得到这个:

0 投票
1 回答
349 浏览

python-3.x - 查找 pandas 日期时间列中的值之间的中点,并根据中点制作开始和结束时间段列

这是我的代码设置:

这会产生一个具有以下形式的数据框:

我想要做的是找到值之间的中点并在数据框中创建两个新列。两个新列是“开始时间”和“结束时间”。“开始时间”是该时间与前一次之间的中点(如果存在)。“结束时间”是该时间与下一次之间的中点(如果存在)。如果不存在,则使用当前时间。

这是我希望代码生成的内容:

任何帮助设置此问题将不胜感激。

0 投票
1 回答
83 浏览

python - 如何从具有不同日期时间索引的另一个数据框中获取列值

我有一个不同间隔的交易数据框,例如。1分钟和5分钟。我希望将计算值从较慢的 5 分钟复制到 1 分钟数据帧。

例如 1min 是这样的: 在此处输入图像描述

我希望在该数据帧中添加一个 forecast_5m 或其他内容,该数据帧具有来自 5min 数据帧的预测列的前 5min 值。由于它是 5 分钟到 1,因此 1 分钟的序列在列中应该有 5 个重复值,与在另一个数据帧中找到的前 5 分钟值不同。

在图片中是 14:53:00,所以它应该得到 14:50:00 的值,等等。到 14:54 的所有分钟都是一样的。我对如何选择最后一次可用的时间感到困惑,因为大多数解决方案都是关于时间范围等,而不是在另一个数据框中找到最新的最接近可用时间。

0 投票
0 回答
112 浏览

python - 如何对具有零阶保持的分组数据帧进行重新采样?

我有一个带有一堆不同测量值的数据框(每个测量值在一measurements列中都有一个唯一的 ID),并且每 10 毫秒采集一次测量样本。

现在我想对所有数据进行下采样,以便为所有测量“伪造”不同的采样时间,例如 40 毫秒。

我实现了重采样,如下所示,但现在我被困住了:我不想.mean()在重采样器对象上执行聚合,因为这将处理来自相应 40 毫秒 bin 中所有样本的信息。

相反,我只想取重新采样的 40 毫秒 bin 中的第一个值并保持它 - 基本上,只需每 40 毫秒选择一次最新的给定值。

有没有一种优雅的方式来做到这一点?

编辑:找到了。只是被忽略.first()为实现我在文档中想要的内置方式:https ://pandas.pydata.org/pandas-docs/version/0.25.1/reference/resampling.html#

0 投票
1 回答
34 浏览

python - 在给定位置的连接和断开时间的情况下查找当前活动连接

我有一个具有连接日期断开日期rowIDRouterName的数据框。我想在一个循环中找到当前活动的连接,该循环每分钟迭代一次(这可以更改为任何分钟),持续 24 小时。我正在尝试从该数据集计算该位置的人数,稍后我将使用该数据集来计算代理感染电晕或任何空气传播传染病的风险水平。我找不到使用 python pandas 从数据集中计算的方法。 在此处输入图像描述

0 投票
1 回答
189 浏览

pandas - 熊猫:将日期列切割成期间日期组/箱

我有一个数据框如下:

我希望将Date列分成几组在一个新列中,称为Date_Bin,规则是:从今天开始,如果Date中的值小于7天,那么新列中的值将是'last 7 days',如果该值小于 14 天且大于 7 天,则该值为“7 到 14 天”,如果该值小于 30 天且大于 14 天,则该值为“14 到30 天,30 到 60 天、60 到 90 天和 90 天以上的逻辑相同。理想的输出是这样的:

正如您所看到的输出,这些是我需要的数据的唯一组/箱。我尝试了几种方法,但都没有奏效,如果有人能提供帮助,我将不胜感激。

0 投票
1 回答
57 浏览

python - yfinance 的最后一个实时蜡烛图

当您从 yfinance 实时下载数据并同时下载多个代码时,您通常会将最后一个数据示例分成几行。

我不在乎这些最小的时间差异,我只想要最后一行中每只股票的最后一个例子。

我一直在考虑对最后一个示例进行分组,但我不确定如何。

请注意,我一次下载的股票可能会更多,可能是 10 个,这意味着它们可以分 10 个单独的行返回。

0 投票
1 回答
55 浏览

python - 熊猫数据框中的重采样和计算均值

我有一个带有 1 列和基于时间的索引的 pandas 数据框。我想每两秒重新采样一次数据并计算列中值的平均值。这是一个例子:

上面的代码给出了这个结果。

在此处输入图像描述

现在,我计算每两秒的平均值。

这给了我如下图所示的结果。

在此处输入图像描述

但我希望得到如图 3 所示的结果。我希望将计算出的平均值放回未重新采样的原始数据帧中。我如何获得它?

在此处输入图像描述

提前致谢。

0 投票
1 回答
36 浏览

pandas - 过滤熊猫特定月份数据的最佳方法

我有财务数据:

我想过滤掉特定月份(例如 11 月)中的所有示例。为了澄清,我想要每年 11 月的数据,无论年份如何。

我想我可以重置索引,然后以某种方式提取月份。

有没有更简单的方法?比如 between_time 提供了过滤掉日内时间间隔的选项。

0 投票
2 回答
28 浏览

python - 为什么我不能从日内时间序列中选择整天?

我有基本的财务 OHLCV 数据。

假设我想选择某一天的所有示例。

即使在使用 lt 或 gt 时可以与字符串日期进行比较,这也不起作用。

所以我创建了日期列

这个新列还不是对象 dtype:

还是不行。