问题标签 [pandas-timeindex]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pandas 滚动时间窗口因字符串计数而失败 - 为什么?
尝试使用带有 timeindex 和 count() 方法的 pandas 滚动,出现错误,我在这里缺少什么?
这是一个例子:
得到这个:
python-3.x - 查找 pandas 日期时间列中的值之间的中点,并根据中点制作开始和结束时间段列
这是我的代码设置:
这会产生一个具有以下形式的数据框:
我想要做的是找到值之间的中点并在数据框中创建两个新列。两个新列是“开始时间”和“结束时间”。“开始时间”是该时间与前一次之间的中点(如果存在)。“结束时间”是该时间与下一次之间的中点(如果存在)。如果不存在,则使用当前时间。
这是我希望代码生成的内容:
任何帮助设置此问题将不胜感激。
python - 如何从具有不同日期时间索引的另一个数据框中获取列值
我有一个不同间隔的交易数据框,例如。1分钟和5分钟。我希望将计算值从较慢的 5 分钟复制到 1 分钟数据帧。
我希望在该数据帧中添加一个 forecast_5m 或其他内容,该数据帧具有来自 5min 数据帧的预测列的前 5min 值。由于它是 5 分钟到 1,因此 1 分钟的序列在列中应该有 5 个重复值,与在另一个数据帧中找到的前 5 分钟值不同。
在图片中是 14:53:00,所以它应该得到 14:50:00 的值,等等。到 14:54 的所有分钟都是一样的。我对如何选择最后一次可用的时间感到困惑,因为大多数解决方案都是关于时间范围等,而不是在另一个数据框中找到最新的最接近可用时间。
python - 如何对具有零阶保持的分组数据帧进行重新采样?
我有一个带有一堆不同测量值的数据框(每个测量值在一measurements
列中都有一个唯一的 ID),并且每 10 毫秒采集一次测量样本。
现在我想对所有数据进行下采样,以便为所有测量“伪造”不同的采样时间,例如 40 毫秒。
我实现了重采样,如下所示,但现在我被困住了:我不想.mean()
在重采样器对象上执行聚合,因为这将处理来自相应 40 毫秒 bin 中所有样本的信息。
相反,我只想取重新采样的 40 毫秒 bin 中的第一个值并保持它 - 基本上,只需每 40 毫秒选择一次最新的给定值。
有没有一种优雅的方式来做到这一点?
编辑:找到了。只是被忽略.first()
为实现我在文档中想要的内置方式:https ://pandas.pydata.org/pandas-docs/version/0.25.1/reference/resampling.html#
pandas - 熊猫:将日期列切割成期间日期组/箱
我有一个数据框如下:
我希望将Date列分成几组在一个新列中,称为Date_Bin,规则是:从今天开始,如果Date中的值小于7天,那么新列中的值将是'last 7 days',如果该值小于 14 天且大于 7 天,则该值为“7 到 14 天”,如果该值小于 30 天且大于 14 天,则该值为“14 到30 天,30 到 60 天、60 到 90 天和 90 天以上的逻辑相同。理想的输出是这样的:
正如您所看到的输出,这些是我需要的数据的唯一组/箱。我尝试了几种方法,但都没有奏效,如果有人能提供帮助,我将不胜感激。
python - yfinance 的最后一个实时蜡烛图
当您从 yfinance 实时下载数据并同时下载多个代码时,您通常会将最后一个数据示例分成几行。
我不在乎这些最小的时间差异,我只想要最后一行中每只股票的最后一个例子。
我一直在考虑对最后一个示例进行分组,但我不确定如何。
请注意,我一次下载的股票可能会更多,可能是 10 个,这意味着它们可以分 10 个单独的行返回。
pandas - 过滤熊猫特定月份数据的最佳方法
我有财务数据:
我想过滤掉特定月份(例如 11 月)中的所有示例。为了澄清,我想要每年 11 月的数据,无论年份如何。
我想我可以重置索引,然后以某种方式提取月份。
有没有更简单的方法?比如 between_time 提供了过滤掉日内时间间隔的选项。
python - 为什么我不能从日内时间序列中选择整天?
我有基本的财务 OHLCV 数据。
假设我想选择某一天的所有示例。
即使在使用 lt 或 gt 时可以与字符串日期进行比较,这也不起作用。
所以我创建了日期列
这个新列还不是对象 dtype:
还是不行。