问题标签 [subsampling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
510 浏览

h2o - 是否有一种“简单”的方法可以使用 h2o.ai 创建分层的帧分割?

分层抽样很古老,而且非常重要。

  • Donald Knuth(计算机科学的大祭司)用它来评估他的博士生的工作,并教授他深刻而真诚的宗教信仰。(链接
  • 皇家学会 1934 年关于该主题的文章。(链接

在 h2o.ai 的 r 接口中,他们有一种方法来分割帧“h2o.splitframe”。有没有办法沿着另一列的不同元素进行分层拆分?

以下是在 h2o 中不执行此操作的 R 包:

0 投票
1 回答
351 浏览

gensim - Gensim 如何在 Word2Vec 中实现子采样?

我正在尝试在 pytorch 中重新实现 wor2vec。我根据原论文的代码实现了二次采样。但是,我试图了解如何在 Gensim 中实现子采样。我查看了源代码,但我没有掌握它是如何重新连接到原始论文的。

提前非常感谢。

0 投票
1 回答
1480 浏览

ffmpeg - 使用 ffmpeg 进行色度二次采样

我想创建一个 .mp4 输出。但它不起作用...

我正在使用 ffmpeg。我的输入视频是原始视频,我希望最后有一个原始视频 .mp4。

我使用的代码:

谁能帮我吗?:)

0 投票
1 回答
175 浏览

python - 为矩形图像创建重叠的方形补丁

给定一个矩形图像img和补丁s。现在我想用边长的正方形补丁覆盖整个图像s,以便img使用最少数量的补丁,其中的每个像素都在至少一个补丁中。此外,我希望相邻的补丁尽可能少地重叠。

到目前为止:我在下面包含了我的代码并制定了一个示例。但是它还不能完美地工作。希望有人发现错误。

示例:Given is imgof shape: 这意味着我将在较长的一侧放置 21 个补丁,在宽度较小的一侧放置 14 个补丁,总共 21*14 = 294 个补丁(4616, 3016)s = 224

现在我试图弄清楚补丁如何分配补丁之间的重叠。我的补丁可以覆盖 size: 的图像(4704, 3136),因此我的高度必须覆盖 88 个重叠像素missing_h = ht * s - h,宽度类似。

现在我试着弄清楚,如何在 21 个补丁上分配 88 个像素。88 = 4* 21 + 4 因此,我将有hso = 17重叠 shso = 4hbo = 4补丁和重叠 5 的补丁,宽度是类似的。

现在我只需遍历整个图像并跟踪我当前的位置(cur_h, cur_w)。在我调整每个循环之后,cur_h, cur_w. 我有s,我当前的补丁号i, j,它表明补丁是否有小或大的重叠。

0 投票
1 回答
1513 浏览

matlab - 在 Matlab 中,当图像在 YCbCr 中时,如何使用色度二次采样将 4:4:4 图像缩小到 4:2:0?

我已经将 jpg 图像从 RGB 转换为 YCbCr,但现在必须使用 Chroma Subsampling 使它们成为 4:2:0。我已经搜索但没有找到有关如何执行此操作的任何信息(注意:我对 Matlab 很陌生)

编辑:我现在有了这个,但是在我设置 ycbcr(:,:,2) = newCb 的底部它说“无法执行分配,因为左侧的大小是 1273-by-1910 和右侧的大小边是 1273×955×0。”

0 投票
1 回答
558 浏览

matlab - 如何在 MATLAB 中手动将 Y Cb Cr 转换为 RGB?

我的任务是对一系列 JPEG 执行 4:2:0 色度二次采样(颜色压缩)。

第一步是确保我可以生成 Y、Cb 和 Cr 值,然后转换回 RGB 并显示图像。然后我可以回去添加我的子采样逻辑。

我很确定我有正确的公式来生成 Y、Cb 和 Cr 值,但我无法找出返回 RGB 和打印的正确方法。
我们不允许使用任何内置函数(这通常会出现在帮助解决这个问题的过程中)。

我附上了如何获取 Y Cb 和 Cr 值以及如何尝试恢复 RGB 的代码。
目前,在这段摘录之后在 newImage 上运行“imshow”时出现绿屏。

orig 是原始图像,newImage 是我在这段摘录之后运行的“imshow”。

0 投票
0 回答
31 浏览

python - 获取numpy数组元素的所有可能组合

我需要获取 numpy 数组所有可能大小的所有可能组合 nCr。

应该给我们一组数组:

有没有聪明的方法来做到这一点?

为方便起见,可以执行所有固定长度的数组 (5):[1,0,0,0,0]、[2,0,0,0,0] 等

0 投票
2 回答
75 浏览

r - 变长df二次采样函数r

n我需要编写一个函数,涉及通过变量bin对 df 进行子集。就像,如果n是 2,则在两个 bin 中对 df 进行多次二次采样(从前半部分开始,然后从后半部分开始)。如果n为 3,则在 3 个 bin(第一个 1/3、第二个 1/3、第三个 1/3)中进行子采样。到目前为止,我一直在手动为不同长度的 n 执行此操作,并且我知道必须有更好的方法来执行此操作。我想把它写成一个n作为输入的函数,但到目前为止我还不能让它工作。代码如下。

这个df是46年的采样。我想假装不是 46 个样本,我只取了 2 个,但在上半年(1:23)随机一年,在下半年(24:46)随机一年。

(如果我们可以让它跳过“NA”样本年份的样本,那就太好了)。

所以,如果我想为三点而不是两点执行此操作,我会重复这样的过程:

但是,我想这样做很多次,最多采样 20 次(所以在 20 个 bin 中),所以这种手动方法是不可持续的。你能帮我写一个函数说“从n个箱子中挑选一个样本x次”吗?

顺便说一句,这是我用完整的df制作的情节:

0 投票
1 回答
573 浏览

python - Gensim word2vec 下采样样本=0

在 Gensim word2vec 中是否sample= 0意味着在我的训练期间没有使用下采样?文档就是这么说的

“有用的范围是 (0, 1e-5)”

但是将阈值设置为 0 会导致 P(wi) 等于 1,这意味着不会丢弃任何单词,我是否理解正确?

我正在处理一个包含 7597 个 Facebook 帖子(18945 个单词)的相对较小的数据集,并且我的嵌入sample= 0在推荐范围内的使用效果要好得多。有什么特别的原因吗?字体大小?

0 投票
1 回答
62 浏览

python - 对一维整数数组进行二次采样,以便总和达到 python 中的目标值

我有两个整数的一维数组,它们有些不同,例如:

我希望每个数组的总和等于两者中最小的数组的总和。但是我想将值保留为整数,而不是浮点数,所以除法不是一种选择。解决方案似乎是对最大数组进行一些子采样,使其总和等于最小数组的总和:

但是,我找不到可以执行这种二次采样的函数。我发现的唯一一个是 scipy,但它们似乎专门用于处理音频信号。替代方案是scikit-bio 包的一个功能,但它不适用于 Python 3.7。