问题标签 [rolling-sum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 日期“参差不齐”的事件的条件滚动总和
介绍
我正在使用 R 来分析非洲抗议运动的“势头”。为此,我正在分析个别抗议事件。我想在一段时间内创建滚动数量(总和)的滚动度量。
Stack Overflow 上的大多数答案都处理以固定间隔观察的数据集(每天或每月一次等)。但是我的数据是“参差不齐的”,因为它们以不同的时间间隔出现。有时观察之间有一天。其他时间有两周。
我想创造什么
过去 10 天内在给定国家/地区发生的抗议事件数量的滚动总和。这将是一个变量的形式,它简单地将过去十天内的事件数量相加,包括当前事件。
数据
这是一组可重现的数据:
我希望数据看起来像什么
这一切可能都很简单,但我不知道该怎么做。先感谢您!
sql - 日期连续时的滚动总和
我试图找出人们在 SQL 中连续工作了多少天。我认为滚动总和可能是解决方案,但不知道如何解决。
我的样本数据是
指定的结果应该是
如果天数不连续,则连续计数将从 1 重新开始。
r - R中具有多个条件的累积和?
我试图弄清楚如何根据几个条件在 R 中创建累积或滚动总和。
有问题的数据集是对图书馆借阅的几百万次观察,问题是确定需要多少份给定书籍/标题才能满足需求。
因此,对于每个 Title.ID,从第一个实例 (ID.Index) 的 1 个副本开始。然后对于之后的每个实例,根据 REQUEST.DATE 是否在前一个请求的 16 周(112 天)内确定是否需要另一个副本。
棘手的部分是,确定是否需要新副本不仅基于请求的数量(ID.Index)和一些先前贷款的 REQUEST.DATE,而且还基于先前的累积总和。
比如第三次请求title 2(Title.ID 2, ID.Index 3),现在有两个副本,所以要判断是否需要新的副本,就得看REQUEST.DATE是否在112以内第一个(不是第二个)请求(ID.Index 1)的天数。相比之下,对于标题 6 的第三次请求(Title.ID 6,ID.Index 3),只有一个可用副本(因为请求 2 不在 112 天内),因此确定是否需要新副本是基于回顾 ID.Index 2 的 REQUEST.DATE。
所需的输出(“Copies”)将获取每个新请求(ID.Index),然后根据可用副本的数量回顾相关的 REQUEST.DATE,这样做意味着查看前面计算的累积总和. (注意:最大副本数为 10。)
我为下面的示例提供了所需的输出(“副本”)。
我认识到解决方案将超出我的能力范围,因此我将非常感谢有关将来如何解决此类问题的任何解决方案或建议。
太感谢了!
*4/19 更新:新示例可能会延迟添加新副本,即不按顺序添加。我还添加了显示自给定先前请求以来的天数的列,这有助于根据有多少副本来检查是否应该添加新副本。
示例 2:应在第三次请求时添加新副本,因为距离上次请求仅 96 天(并且只有一个副本)
示例 3:新副本应与最后一个请求一起添加,因为有两个副本,最早的请求是 45 天。
list - Scala:计算具有固定窗口的列表的移动和
我是 Scala 的新手,我想计算一个列表的固定窗口的移动总和。
例如:给定列表值 (1.0, 2.0, 3.0, 6.0, 7.0, 8.0, 12.0, 9.0, 4.0, 1.0) 和周期 4,函数应该返回:(1.0, 3.0, 6.0, 12.0, 18.0, 24.0, 33.0, 36.0, 33.0, 26.0)
如果 list.size < period 然后只返回累积总和。
我做了一些尝试
然而,我得到了
这是不正确的。我不想使用 Pyspark 来获得结果。有人可以帮忙吗?
非常感谢。
python-3.x - 如何通过获取另一个数据框的滚动 COLUMN 总计/总和来创建新的数据框?
df1
df1 是我的原始数据框。我想通过添加每个连续的 4 列(滚动列总和)来创建另一个数据框。
df2
df2 是添加 df1 的 4 个连续列后的结果数据帧。
例如:df2中的h列是df1中a、b、c、d列的总和;df2 中的 i 列是 df1 中 b、c、d、e 列的总和;df2 中的 j 列是 df1 中 c、d、e、f 列的总和;df2 中的 k 列是 df1 中 d、e、f、g 列的总和。
我找不到任何类似的问题/答案/示例。我将不胜感激任何帮助。
python - 从 pandas 数据框列值的两侧添加 n 个值
我有一个这样的数据框,
我想添加 col2 特定值的上一个和下一个 n 值并将其存储到一个新列中,
所以,如果 n=2,那么数据框应该是这样的,
当找不到前一个或下一个 2 值时,添加任何可用的值。我可以使用 for 循环来做到这一点,但是执行时间会很长,寻找一些 pandas 快捷方式可以最有效地做到这一点。
r - R data.table中具有阈值窗口的累积和
我想计算我的数据集中 n 行的滚动总和,其中窗口大小“n”取决于总和本身。例如,我想在滚动时间总和超过 5 分钟时滑动窗口。基本上,我想计算这个人在最后 5 分钟内行进了多少距离,但时间步长并不相等。为了清楚起见,这是一个虚拟的 data.table(最后两列是必需的):
我正在寻找 R 中的 data.table 解决方案
输入数据表:
ID | 距离 | 时间 |
---|---|---|
1 | 2 | 2 |
1 | 4 | 1 |
1 | 2 | 1 |
1 | 2 | 2 |
1 | 3 | 3 |
1 | 6 | 3 |
1 | 1 | 1 |
期望的输出:
ID | 距离 | 时间 | 5.min.rolling.distance | 5.min.rolling.time |
---|---|---|---|---|
1 | 2 | 2 | 不适用 | 不适用 |
1 | 4 | 1 | 不适用 | 不适用 |
1 | 2 | 1 | 不适用 | 不适用 |
1 | 2 | 2 | 10 | 6 |
1 | 3 | 3 | 5 | 5 |
1 | 6 | 3 | 9 | 6 |
1 | 1 | 1 | 10 | 7 |
python - 带有 groupby 的 Pandas 数据框滚动总和列
我正在尝试创建一个新列,该列给出列中值的滚动总和Values
。滚动总和包括 4 行,即当前行和接下来的三行。我想为“类型”列中的每种类型执行此操作。
但是,如果在下一个类型开始之前少于 4 行,我希望滚动总和仅使用剩余的行。例如,如果当前类型的当前行之后有 2 行,则总共 3 行用于滚动和。请参阅下表,显示我目前得到的和我的期望。
指数 | 类型 | 价值 | 当前滚动总和 | 预期滚动总和 |
---|---|---|---|---|
1 | 剩下 | 5 | 22 | 22 |
2 | 剩下 | 9 | 34 | 34 |
3 | 剩下 | 0 | 钠 | 25 |
4 | 剩下 | 8 | 钠 | 25 |
5 | 剩下 | 17 | 钠 | 17 |
6 | 直的 | 7 | 61 | 61 |
7 | 直的 | 4 | 77 | 77 |
8 | 直的 | 0 | 86 | 86 |
9 | 直的 | 50 | 97 | 97 |
10 | 直的 | 23 | 钠 | 47 |
11 | 直的 | 13 | 钠 | 24 |
12 | 直的 | 11 | 钠 | 11 |
以下代码行是我目前用来获取滚动总和的代码。
我将衷心感谢您的帮助。
r - 如何在R中按组获得计数(滚动总和)?
我想在我的数据集中创建一个名为“tally”的列,该列对每种类型和排名的计数求和。
我想要的输出是:
我想另一种描述它的方式是滚动总和(考虑到从低到高的顺序)?我环顾四周,但找不到任何好的功能来做到这一点。理想情况下,我可以有一个 for 循环,它可以让我按类型获得这个“滚动总和”。