问题标签 [resampling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
86 浏览

algorithm - 使用固定内存量计算百分位数

我有一个以一定速率到达的 int 值流。每 5 分钟,我想根据这些值计算一些百分位数,然后重新开始。

问题:我不想浪费太多内存,所以我只想保留几个 KB 的值。如果我的缓冲区在 5 分钟内没有填满,我可以完美地计算百分位数。但是,如果缓冲区确实填满,我想开始删除一些值(可能使用此处建议的水库采样和随机驱逐 - Percentiles of Live Data Capture)。不幸的是,我找不到在这两种情况下都适用的解决方案 - 如果缓冲区未满,我不想驱逐或忽略值,一旦它满了并且我开始驱逐,我总是会引入偏见。

0 投票
1 回答
293 浏览

scala - scala中的重采样,功能方式

我有一个样本数组 D,我想用替换统一重新采样以构造一个新数组。程序解决方案非常简单,但我想知道是否有人对如何以“功能方式”进行操作有一些想法?(我刚刚学习了 Scala 和函数式编程)

一个功能实现来证明我的意思:

0 投票
1 回答
1725 浏览

python - 仅知道结果测量计数对 pandas 数据帧进行重新采样

我有一个如下所示的数据框:

我想重新采样我的数据,以便每次试验只有两个测量值所以我想把它变成这样的东西:

这个相当罕见的任务源于这样一个事实,即我的数据在刺激呈现部分存在有意的抖动。

我知道 pandas 有一个 resample 函数,但我不知道如何将它应用到我的二级索引,同时根据一级索引将数据保持在离散类别中:(

另外,我想迭代我的一级索引,但显然

不起作用,因为因为'Trial'是索引 pandas 找不到它。

0 投票
1 回答
2006 浏览

python - 使用“bin size”/“frequency”重新采样 Pandas Dataframe

9我有一个多索引数据框,我想对其重新采样以将数据点的频率降低 3 倍(这意味着每 3 行变为 1 行)。

这个:

我想变成这样:

我试图像这样将我的时间列变成熊猫日期时间索引,然后使用重新采样:

但是第一行给了我实际的日期(1970 年左右),这对第二行没有帮助。浏览 arund 堆栈溢出时,我发现了一些类似的 quiestios,它们都有不基于 panda 的重采样的解决方案——而且,遗憾的是,这对我的用例不可行。

你能帮我一把吗?

0 投票
1 回答
1662 浏览

matlab - 在时域中以最小的信息损失重新采样数据

我正在尝试重新采样/重新创建已记录的数据以用于绘图目的。我认为这是提出问题的最佳场所(除了 dsp.se)。

数据采样频率很高,包含很多数据点,不适合在时域中绘制(内存不足)。我想以最小的损失对其进行采样。结果数据的采样间隔不需要相同(它再次用于绘图目的,而不是分析),尽管输入数据的采样相同。当我们使用 matlab/octave 中的常规重采样命令时,它会扭曲曲线的僵硬部分。

这里最好的方法是什么?

作为参考,我放了两张在 tex.se 中找到的图片)第一张图片是常规重采样第二张图像是更好的重采样数据,可以很好地在峰值附近表现。 在此处输入图像描述 在此处输入图像描述

0 投票
3 回答
31961 浏览

python - 对一维 numpy 数组进行下采样

我有一个一维 numpy 数组,我想对其进行下采样。如果下采样栅格不能完全拟合数据,则可以使用以下任何方法:

  • 重叠下采样间隔
  • 将最后剩余的任何数量的值转换为单独的下采样值
  • 插值以适应栅格

基本上如果我有

而且我将采样率降低了 3 倍,以下所有情况都可以:

或任何插值在这里给我的东西。

我只是在寻找最快/最简单的方法来做到这一点。

我找到scipy.signal.decimate了,但这听起来像是对值进行了抽取(根据需要将它们取出,并且只在 X 中留下一个)。 scipy.signal.resample似乎有正确的名字,但我不明白他们在描述中的整个傅立叶事件的去向。我的信号不是特别周期性。

你能帮我一下吗?这似乎是一项非常简单的任务,但所有这些功能都非常复杂......

0 投票
1 回答
513 浏览

arrays - 沿一维内插非单调采样的 ND 数组

我有一个 3D 体积(80x80x3 点)的测量值([646 2] 值和时间点)。此数据未排序,并且样本时间点之间的时间不等距。我想重新采样/插值以减少时间点(比如 [0:0.1:1] 间距)。所有数据一起变成一个 [80 80 3 646 2] 数组,其中 [: : : : 2] 是时间,我想对其进行插值。

我的第一次尝试是使用 interp1 但下面的回答已经进一步帮助了我,现在我不确定的问题是当它与测量值共享其维度时如何插入时间?我的意思是 [: : : : 1] 是值, [: : : : 2] 是时间点。

0 投票
1 回答
544 浏览

r - 在 R 中模拟样本,存储它们并计算测试统计量

我使用蒙特卡罗算法通过反演采样生成几何分布大小为 100 的数据样本:

上面的函数是几何分布的 CDF 的倒数

我不知道该怎么做是随机模拟 1000 个大小为 100 的数据样本并计算每个样本的卡方检验统计量。我创建示例的尝试如下:

}

但是,这给了我控制台的所有示例,以后无法引用它们。

我真的很感激一些帮助。

谢谢

0 投票
1 回答
1326 浏览

python - 重新采样,同时保留输入文件的最后日期(而不是由 `resample` 计算的最后一天)

使用 python pandas(但对任何其他解决方案开放),我想对 DataFrame 进行上采样,同时保留我输入文件中的最后一个日期。的默认工作方式DataFrame.resample是计算该月的最后一天。这是我的例子:

我期望的输出是:

请注意日期 2013-02-20。这是我输入数据中的真实日期,而不是由resample.

0 投票
1 回答
13713 浏览

r - 如何用不同程度的栅格创建栅格砖?

我是R新手,所以这个问题非常基础,但我一直在努力解决,找不到有效的解决方案。我想从同一区域的一些陆地卫星图像创建一个光栅砖。它们以HDF-EOS格式下载,我使用Modis Reprojection Tool将它们转换为.tif.

生成的栅格具有相同的投影,但其范围、分辨率和原点不同。

我尝试了几种方法,总结如下:

  1. 手动定义子集范围并对所有栅格进行子集化。然后尝试用子集栅格制作砖块

  2. 重新采样栅格,为它们提供相同数量的列和行。理想情况下,这将确保光栅单元对齐并且可以放入光栅砖中。此选项创建了一个砖块,其中栅格没有值,它们是空的。

我想知道我应该遵循什么概念来纠正程度。创建一个空栅格,然后用导入的 landsat 图像的值填充它是否正确(且有效)?你能看出我在哪里犯错了吗?如果相关,我正在使用Mac OSX 版本 10.9.1,并使用rgdal 版本 0.8-14

任何帮助将不胜感激!

谢谢

我在这里添加我一直在使用的代码: