问题标签 [rolling-computation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 滚动回归 - 但只得到一个 beta
我正在尝试在 r 中运行以下代码,因为我想计算 10 天时间段内的滚动回归,并且我想每天计算一次。但是,在整个 5 年期间,我得到一个包含单个系数和 beta 的列。我在这里做错了什么。请帮忙。
mydatareturns是自变量 v2 和因变量 v1 的每日回报。
r - 带有 Copulas 的滚动窗口
我想应用一个滚动窗口来拟合一个学生 t Copula,然后根据拟合过程的结果进行预测。我已经尝试过使用 for 循环,但它总是根据 fit Copula 命令声明错误。
这里已经出现了第一个错误:“if (any(u < 0) || any(u > 1)) stop("'u' must be in [0,1] - 可能宁愿使用 pobs(.) ") : 需要 TRUE/FALSE 的缺失值"
也许有人有解决这个问题的方法?
r - 滚动百分比沿列添加
我觉得这在基础 R 中应该很容易,但我就是想不通。我有一个简单的数据框,假设它看起来像这样
现在,我想做的是创建一个将应用滚动 % 添加的函数,例如:
它接受上面的数据框为tbl
. 它将当前行的百分比分数添加到基于 的 NEXT 行中pct
,并且几乎以累积方式滚动。
例如,fn(tbl$Field1, 0.1)
将生成以下结果:
等等
我会使用包解决方案,但更喜欢 base R,因为它有助于学习过程!我的长期目标是通过 field 和 pct 的每个组合构建一个循环过程,以便我可以在回归模型中测试它的效果;因此,我的直觉是我以后可以应用的功能是前进的方向。
谢谢。
python - 看到索引的 Pandas DataFrame 自定义滚动函数
我想在具有日期索引的 DataFrame 上应用偏移滚动窗口函数。这是一个例子:
这会产生一个 DataFrame df
,如:
但我无法弄清楚如何在我应用于Rolling
窗口的任何函数中查看与每个 Val 关联的日期。例如,以下内容:
表明我所看到的只是ndarray
每次通话的一个:
有没有办法以聚合函数看到与窗口中每个值关联的索引的方式在 DataFrame 上调用时间偏移滚动窗口?
例如,这样我就可以应用一个看起来像这样的函数:
python - pandas 中的条件滚动计算
我想计算一个称为“下行 beta”的数量。假设我有一个数据框 df:
我想添加一个列“C”,它计算这个下行 beta 定义为列 A 和 B 之间的协方差,仅考虑 A 列的负值与 B 的相应值。然后应该将该协方差除以方差列 A 仅考虑负值。
在上面的例子中,它应该相当于计算两个序列之间的协方差:[-0.1,-0.4,-0.5] 和 [-0.2,0.3,0.1]。除以序列的方差 [-0.1,-0.4,-0.5]。
下一步是在初始大数据帧 df 的索引上滚动该指标。
有没有一种有效的方法来做到这一点?以矢量化的方式。我猜想结合 pd.rolling_cov 和 np.where?
谢谢!
python - pandas 为每列/行应用不同的参数
假设我有一个 M(行)乘 N(列)数据帧
和一个长度为 N 的向量
我想对 中的每一列应用移动平均函数df
,但希望移动平均对于每一列具有不同的长度(例如,column1 的 MA 长度为 1,column 2 的 MA 长度为 2,等等) - 这些长度包含在windows
是否有内置函数可以快速执行此操作?我知道df.apply(lambda a: f(a), axis=0, args=...)
但不清楚如何为每列应用不同的参数
python - 具有时变窗口的python/pandas滚动总和
我有一个数组
和一个窗口列表(长度为 N)
arr
是否可以对存储的时变窗口进行滚动和计算windows
?
例如,在 t=3 时,您有arr=[1,2,3]
,window=1
因此这表示返回 1 天的滚动总和,这样out[2] = 3
在t=2
,你有arr = [1,2]
并且 window=2 所以这将表示一个 2 天的滚动总和,这样out[1]=3
python - 蟒蛇熊猫。如何使用滚动窗口进行减法
我想取一个大小为 8 的滚动窗口,然后减去它的平均值。我认为这样做很简单。
显然这是错误的。我在这里阅读了文档https://pandas.pydata.org/pandas-docs/stable/computation.html
所以我想使用 .apply()
这也不起作用,对我来说似乎不是好的代码。
我将以下内容修改为哑巴,但它不起作用。它指出需要一个浮点数作为错误。
任何帮助表示赞赏。
编辑添加的表格以澄清我的要求。寻找最终价值。
编辑 2:使用 100k + 行,因此窗口方法很重要。
r - 根据 P 值绘制滚动系数和颜色
这有点棘手!我正在运行回归的滚动窗口,并且正在收集每个窗口的所有系数。我的目标是绘制系数如何随时间波动。此外,我希望通过在不显着时给出不同的色点,当发现系数具有统计显着性(比如在 95% 时)时,该图给出不同的颜色。
到目前为止,我所拥有的是:
情节产生:
例如说第二个和第四个系数(图中的项目符号)在统计上是不显着的;那么它们的颜色应该是绿色的。
Data (LaggedPannel)
:
python - 列日期的 1 年滚动平均熊猫
我想计算此 Dataframe 中每一行的 1 年滚动平均值test
:
例如,我需要计算:
7034
2018-03-14 和 2017-08-14 之间id 变化的平均值7034
2018-03-13 和 2017-08-13 之间id 变化的平均值- 等等
我试过了:
但我收到错误消息:
在这种情况下如何使用 pandasrolling()
功能?
[编辑 1] [感谢 Sacul]
我测试过:
但是freq='Y'
不起作用(我得到了:)ValueError: Invalid frequency: Y
然后我使用了window = 365, freq = 'D'
.
但是还有另一个问题:因为每个组合的日期都没有 365 个连续日期id-date
,所以结果总是空的。即使缺少日期,我也想忽略它们并考虑当前日期和(当前日期 - 365)之间的所有日期来计算滚动平均值。例如,假设我有:
然后,
- 对于 7034 2018-03-14:我想计算 MEAN(4.139148e-06,4.953194e-07, 2.854749e-06)
- 对于 7034 2018-03-13:我也想计算 MEAN(4.139148e-06,4.953194e-07, 2.854749e-06)
我怎样才能做到这一点?
[编辑 2]
最后,我使用下面的公式通过忽略缺失值来计算 1 年的滚动中位数、平均值和标准差: