问题标签 [rolling-computation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python - GroupBy 对象的滚动函数
我有一个grouped
类型的时间序列对象<pandas.core.groupby.SeriesGroupBy object at 0x03F1A9F0>
。grouped.sum()
给出了预期的结果,但我无法让 rolling_sum 使用该groupby
对象。有没有办法将滚动功能应用于groupby
对象?例如:
但是,我想要类似的东西:
r - 数据帧的滚动拖欠计算
我是 R 新手,并试图通过滚动方式计算 3 个月的拖欠。
我的数据框由(CID、acquistion_date 和 delinquient)组成
我正在尝试创建一个新的数据帧,其中附加了第 4 列(Roll_deliquency),即过去 3 个月的拖欠计数)。一旦我们有了新的客户 ID,我们就会重新开始该客户的第一笔交易。Roll_Deliquiency 是过去 3 个月 的拖欠总数。
预期结果如下
有人可以帮我写R代码吗?我尝试使用滚动应用,但无法根据需要进行自定义。
r - 将滚动功能应用于 xts 对象列表
这类似于其他几个问题,但我仍然没有设法让它工作。我正在尝试将滚动功能(runMAD
来自 TTR 包)应用于一系列财务信息(交易价格和交易量),但滚动操作都应该是当日的(即不会跨入第二天,也不会从前一天开始) )。
数据存储为 xts 对象,具有两列(价格和数量)。我按天拆分此对象以按天创建 xts 对象列表,希望我可以runMAD
在每天应用该函数,并返回一个包含四列的 xts 对象列表(两个原始价格和交易量列,然后是两个新的 runMAD-price 和 runMAD-volume)。然而,它似乎lapply
只能返回一个长度等于天数的列表 - 所以像每日平均值这样的函数可以工作,但不确定如何让滚动函数工作,每天抛出多个结果。最后,我想测试每一行价格和交易量,看看它与中位数的偏差是否比其各自的滚动 MAD 大 3 倍。然后将此类实例保存在变量中(使用 xts 索引)。
[编辑:根据 GSee 的评论,这里是一个更大的(和固定的)数据样本:]
在同一时间段内经常有多笔交易,在这种情况下,runMAD
如果还没有,我希望单独查看每笔交易。此外,我意识到 的窗口runMAD
可能大于特定日期的交易数量,在这种情况下,我想忽略当天的(NA) - 或者如果可能的话,将runMAD
窗口大小动态减小为交易数量在那一天。
我的数据的str:
str(样本。数据)
我split
这几天然后runMAD
:
为了避免应用于runMAD
观察次数少于窗口长度的日子,我只保留观察次数充足的日子:
我也试过这个:
但它会引发与上述相同的错误(runMedian(x, n,累积=累积)中的错误:(列表)对象不能被强制输入'double')。
我没有将数据放入列表中以分解为天,而是尝试了以下方法:
这个问题的一个细微变化是看看如何对移动时间窗口(例如 1 小时)而不是移动交易窗口进行同样的处理。
无论窗口是基于时间还是基于观察,我都想最终创建一个 xts 对象,其中包含所有观察值(价格或交易量)与某个窗口中位数的偏差除以 MAD(在中间-窗口),高于某个阈值(例如 3)。由于当一半的观察值相同时,MAD 将为 0,我想用任何先前的 MAD>0 替换任何 0。
python - 进行滚动线性回归的有效方法
我有两个向量 x 和 y,我想为它们计算一个滚动回归,例如 a on(x(1:4),y(1:4)), (x(2:5),y(2:5)), ...
是否已经有一个函数了?我为此想到的最佳算法是 O(n),但在每个子阵列上应用单独的线性回归将是 O(n^2)。我正在使用 Matlab 和 Python (numpy)。
python - 熊猫:按时间间隔滚动平均值
我有一堆投票数据;我想计算一个 Pandas 滚动平均值,以根据三天的窗口估算每一天。根据这个问题,rolling_*
函数根据指定数量的值计算窗口,而不是特定的日期时间范围。
如何实现此功能?
样本输入数据:
每个日期的输出只有一行。
r - 根据日期移动总和
我是一个大型数据集,我想计算一列的移动年度总和。它必须是一个确切的年份,所以我不能使用 rollapply 作为它基于特定天数而不是实际日期。
例如,我有以下代码:
我想要列 num 的滚动一年历史总和。
我设法解决它的唯一方法是使用循环和数据框的子集。这不是很有效,我希望有人可以建议我如何使用嵌入功能来计算闰年,因为它要快得多。
使用嵌入函数,只要不是闰年,我就可以使用以下代码。
有没有人有更有效的方法来计算基于特定日期而不是天数的移动总和?
sql - SQL 滚动周期 20 天
我想知道如果在 20 天的任何连续时间内,事件数量超过 10,最好的方法是什么。
我正在尝试编写异常报告,但除了使用循环之外无法弄清楚逻辑。
我已经包含了表的架构。
我有一个部分解决方案:'
知道了。对于有兴趣从现在起 20 个工作日内查找日期的任何人,我在下面添加了解决方案。:) (我觉得我好笨!)
r - 具有多个匹配项的 data.table 中的滚动联接
我有一个关于滚动连接的评论/问题
让 X,Y 为:
在这里X
并按Y
x,y,t
从
执行Y[X, roll=-0.005]
让你
所以我本来希望在最后一行得到更多的行,因为“mult”的默认行为是“all”,最后一行X
与5,6, may be 7
Y
sql - 对合并值使用滚动平均值
我无法使计算列显示平均值。请参见:
如何使这个显示平均 3 列?有时,可能不会填充 mnth2 和 mnth3。我试图将合并的月份除以一个计数,以防任何给定时间为空。我收到一条错误消息,提示选择列表无效。有什么建议么?