问题标签 [rolling-computation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中,可以跳过 NA 值的滚动标准偏差?
我想知道是否有任何快速 R 函数可以计算向量上的滚动标准偏差,同时跳过所述向量中间的任何 NA 值,因此向量仍然与原始数据对齐?
包TTR
有runSD
,但如果向量中间有 NA,它会返回错误。
包fTrading
有rollVar
哪个有na.rm=TRUE
。取滚动方差的平方根给出标准偏差。但是,它实际上删除了 NA 值,这意味着滚动标准偏差不再与原始数据一致。
或者,有没有办法暂时删除 NA 值,然后在计算完成后将它们重新插入?
更新
请参阅将 NA 重新插入向量中。
r - R中向量中的连续/滚动和
假设在 RI 中有以下向量:
如何执行一个操作,在每个索引处将 3 个连续元素相加,得到以下向量:
其中第一个元素 = 1+2+3,第二个元素 = 2+3+10 等等...?谢谢
mysql - 在mysql中创建一段时间内的滚动总和
我有一个带有列date
和的表time_spent
。我想为每个日期 D 找到一段时间内“time_spent”的值的总和:(D-7 - D),即。过去一周 + 当前日期。
我想不出办法来做到这一点,因为我只能找到总和的例子,而不是可变时间段内的总和。
这是一个数据集示例:
结果看起来像:
r - 将滚动回归产生的所有数据合二为一
我正在对一个庞大的数据库进行滚动回归,用于滚动的参考列称为“Q”,每个数据块的值从 5 到 45。起初我一步步尝试了简单的代码,效果很好:
上面代码的结果是:
数据池的结构如下:
上面产生的错误在“datapool”中都标有“X”值,所以我可以知道错误来自哪个公司。
由于我需要运行回归 21 次(季度 5-24,6-25,...,25-44),所以我不想手动进行,并考虑了以下代码:
上面的代码可以正常工作,没有报错,但是不知道如何将每次回归产生的所有错误自动编译到一个数据池中?任何人都可以帮助我吗?
r - 有效地计算 R 中的滚动行总和
我需要计算涉及条件的数据框中列的滚动行总和。我拥有的数据对“sku”有多个观察结果。我想要的是为“sku”的每个值计算 5 个连续行的总和。如果我达到一个阶段,我没有对“sku”进行 5 次连续观察,我们将总结该相应值的剩余行观察结果。
对于一个说明性示例,请考虑以下数据框:
在这个数据框中,我们想为每个“sku”值的 5 个滚动值求和变量“tf”。
我们已经能够使用以下代码来实现这一点:
列“day_5”准确地为我们提供了我们想要的结果,但这种方法效率非常低,因为我们必须对具有数千个“sku”值的数百万行数据运行此操作。
有人可以帮助我们以一种可以将其扩展到大数据的方式优化此代码吗?
sql - 过去 3 个月 Where 声明
我有一个 SQL 语句(SQL Server Management Studio),我通过仪表板软件将数据传递到 where 语句中。用户可以选择年份(2013 年或现在 2014 年)以及月份(作为数值传递 - 所以 12 月 = 12)。我需要将声明调整为我从他们选择的年/月中获得最后 3 个月的位置。之前,b/c 的 SQL 语句只处理 2013 年的数据,就是这样:
通常情况下,parmYear = 2013,然后无论他们选择什么月份,它将在当前月份之前 2 个月获取。
现在,b/c 现在是 2014 年 1 月,我需要抓住 2014 年 1 月 + 2013 年 12 月 + 2013 年 11 月。我想知道如何调整语句以使这种情况动态发生。
想法?
r - 创建一个循环来计算不同滚动平均长度的向量的滚动平均值
我正在尝试创建一个“for循环”设置,该设置将计算返回系列的不同滚动均值,其中我使用从最后 2 个观测值到最后 16 个观测值的滚动均值。kϵ[2,16]。我一直在尝试使用这样的函数,其中“rollmean”是动物园的一个函数。这会产生警告“警告消息:在 roll[i] <- rollmean(x, i) 中:要替换的项目数不是替换长度的倍数”有人可以帮我吗?
python - 时间序列数据与 Pandas 的滚动相关性
下面是我的数据的一个小样本。我在某些时间有一些值,标记为 A,我想将其与特定时间的价格相关联,标记为 B。
每个 A 值都考虑到相应时间的间隔。值 0.054873437864689699 是从午夜到 651.0 分钟(或上午 10:51)。值 0.055546509015723597 是从 651.0 到 653.0 分钟(或 10:51am 到 10:53am)等等。
每个 B 值都是在相应时间精确到毫秒的价格。我可以简单地在一个区间内平均价格,以将时间与 A 值匹配。
我在 Pandas 文档中找到了“rolling_corr_pairwise”。我对 Pandas 完全陌生,需要一个超级简化的分步说明来说明如何实现这一点。制作 DataFrame 对我来说也是新事物。我想在例如 50 分钟的窗口中查找并绘制 A 和 B 值与时间的滚动相关性。我意识到列出时间的方式(从午夜开始的分钟数)很糟糕,所以感谢您对我的包容。
要关联的 A 值
[0.054873437864689699, 0.055546509015723597, 0.056806870789744064, 0.05656315835834981, 0.056307375921714732, 0.056614971519205935, 0.058407075702340799, 0.058483089024092987, 0.059124318881877719, 0.057917622539541552, 0.058499741855677162, 0.059480023024158751, 0.059925414031410718, 0.059699384112206717, 0.059783470585893353, 0.058500193498812712, 0.056660594185120206, 0.057215267146834899, 0.054616609322569204, 0.053707026223574213, 0.053727363037656489, 0.052396419451433848, 0.051417634891722949, 0.050305835255857634, 0.050611614412277413 , 0.050005571241158321, 0.051123891272704211, 0.049674112051554621, 0.049446781886845974, 0.047887309892200268]
A-自午夜以来的分钟数
[651.0,653.0,656.0,657.0,658.0,661.0,661.0,663.0,665.0,666.0,668.0,668.0,671.0,671.0,673.0,674.0,674.0 , 693.0, 696.0, 700.0, 701.0, 704.0]
B-价格,与 A 相关
[116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.32, 116.32, 116.32, 116.32, 116.32, 116.32, 116.33, 116.33, 116.33, 116.33 , 116.33, 116.33, 116.3201, 116.33, 116.33, 116.33, 116.3201, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33, 116.33 ]
B-从价格午夜开始的分钟数,其中 1 毫秒 = 分钟/60000
[629.5010833333333, 629.5010833333333, 629.5013166666666, 629.5013166666666, 629.5013166666666, 629.5018166666666, 629.5047, 629.507, 629.5070666666667, 629.5071166666667, 629.508, 629.508, 629.508, 629.508, 629.508, 629.5080333333333, 629.5080666666667, 629.5080666666667, 629.5080666666667, 629.5080666666667, 629.5080666666667, 629.5081, 629.5081833333334, 629.5081833333334, 629.5082166666666 , 629.50865, 629.50865, 629.5087166666667, 629.5093166666667, 629.5098333333333, 629.5195, 629.5197, 629.5240166666666, 629.5316333333333, 629.5316666666666, 629.5316666666666, 629.5316666666666, 629.5316666666666, 629.5316666666666, 629.5316666666666, 629.5317666666666, 629.5317666666666, 629.5317666666666, 629.5317666666666, 629.5317666666666, 629.5317666666666, 629.5320333333333, 629.5325, 629.5325333333333, 629.5365833333333 ]
python - 具有分层索引和滚动/移位的 Python pandas 时间序列
与熊猫的滚动和移动概念作斗争。在这个论坛中有很多很好的建议,但我很遗憾地将这些建议应用到我的场景中。
现在我在时间序列上使用传统的循环,但是,迭代超过 150,000 行大约需要 8 个小时,这对于所有代码来说大约是 3 天的数据。有 2 个月的数据来处理它可能不会在我休假回来后完成,更不用说断电的风险,之后我必须重新开始,这次没有休假,等待。
我有以下 15 分钟的股票价格时间序列(日期时间(时间戳)和股票代码的层次索引,唯一的原始列是 closePrice):
我需要添加两列:
- 12sma,12天移动平均线。搜索了几个小时后,最好的建议是使用 rolling_mean,所以我尝试了。但考虑到我的 TS 结构,它不起作用,即它自上而下地工作,第一个 MA 是基于前 12 行计算的,而不管不同的股票代码值。我如何根据索引(即第一个日期时间然后股票代码)使其平均值,以便我获得 MA 表示 AAPL?目前确实如此(AAPL+EQIX+FB+GOOG+MSFT+AAPL...直到第 12 行)/12
- 一旦我得到 12sma 柱,我需要 12ema 柱,12 天指数 MA。对于计算,每个代码的时间序列中的第一个值只会从同一行复制 12sma 值。随后,我需要同一行的 closePrice 和前一行的 12ema,即过去 15 分钟。我做了长时间的研究,似乎解决方案是滚动和移位的组合,但我不知道如何将它们组合在一起。
任何帮助我将不胜感激。
谢谢。
编辑:
感谢 Jeff 的提示,在交换和排序 ix 级别之后,我能够使用 rolling_mean() 正确地获得 12sma,并努力在同一时间戳插入从 12sma 复制的第一个 12ema 值:
我知道 pandas 有 pandas.stats.moments.ewma 但我更喜欢使用我从一本书中得到的公式,该公式需要“目前”的收盘价和前一行的 12ema。
因此,我尝试从 2 月 5 日 15:45 开始填充 12ema 列。我用一个函数尝试了 apply() 但 shift 给出了一个错误:
我想到的另一种可能性是 rolling_appy() ,但它超出了我的知识范围。
r - R中使用roll apply的滚动回归
我导入的数据包含 7 个变量:Y
and X1
, X2
, X3
, X4
, X5
, X6
. 我尝试应用该rollapply
函数,zoo
以便在具有 262 obs 窗口的样本内运行滚动回归。(一年中的工作日)。
最后一行由于某种原因没有显示值,即使原始 excel 文件中有(X3、X4、X5、X6 丢失,因为这些列彼此堆叠,我从以顶部为例。
我的代码是:
我得到的错误信息是:
我真的很想知道为什么它找不到Y
变量,因为它以适当的标题显示在时间序列数据集中。