问题标签 [subsampling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
h2o - 是否有一种“简单”的方法可以使用 h2o.ai 创建分层的帧分割?
分层抽样很古老,而且非常重要。
在 h2o.ai 的 r 接口中,他们有一种方法来分割帧“h2o.splitframe”。有没有办法沿着另一列的不同元素进行分层拆分?
以下是在 h2o 中不执行此操作的 R 包:
gensim - Gensim 如何在 Word2Vec 中实现子采样?
我正在尝试在 pytorch 中重新实现 wor2vec。我根据原论文的代码实现了二次采样。但是,我试图了解如何在 Gensim 中实现子采样。我查看了源代码,但我没有掌握它是如何重新连接到原始论文的。
提前非常感谢。
ffmpeg - 使用 ffmpeg 进行色度二次采样
我想创建一个 .mp4 输出。但它不起作用...
我正在使用 ffmpeg。我的输入视频是原始视频,我希望最后有一个原始视频 .mp4。
我使用的代码:
谁能帮我吗?:)
python - 为矩形图像创建重叠的方形补丁
给定一个矩形图像img
和补丁s
。现在我想用边长的正方形补丁覆盖整个图像s
,以便img
使用最少数量的补丁,其中的每个像素都在至少一个补丁中。此外,我希望相邻的补丁尽可能少地重叠。
到目前为止:我在下面包含了我的代码并制定了一个示例。但是它还不能完美地工作。希望有人发现错误。
示例:Given is img
of shape:
这意味着我将在较长的一侧放置 21 个补丁,在宽度较小的一侧放置 14 个补丁,总共 21*14 = 294 个补丁(4616, 3016)
。s = 224
现在我试图弄清楚补丁如何分配补丁之间的重叠。我的补丁可以覆盖 size: 的图像(4704, 3136)
,因此我的高度必须覆盖 88 个重叠像素missing_h = ht * s - h
,宽度类似。
现在我试着弄清楚,如何在 21 个补丁上分配 88 个像素。88 = 4* 21 + 4 因此,我将有hso = 17
重叠 shso = 4
的hbo = 4
补丁和重叠 5 的补丁,宽度是类似的。
现在我只需遍历整个图像并跟踪我当前的位置(cur_h, cur_w)
。在我调整每个循环之后,cur_h, cur_w
. 我有s
,我当前的补丁号i, j
,它表明补丁是否有小或大的重叠。
matlab - 在 Matlab 中,当图像在 YCbCr 中时,如何使用色度二次采样将 4:4:4 图像缩小到 4:2:0?
我已经将 jpg 图像从 RGB 转换为 YCbCr,但现在必须使用 Chroma Subsampling 使它们成为 4:2:0。我已经搜索但没有找到有关如何执行此操作的任何信息(注意:我对 Matlab 很陌生)
编辑:我现在有了这个,但是在我设置 ycbcr(:,:,2) = newCb 的底部它说“无法执行分配,因为左侧的大小是 1273-by-1910 和右侧的大小边是 1273×955×0。”
matlab - 如何在 MATLAB 中手动将 Y Cb Cr 转换为 RGB?
我的任务是对一系列 JPEG 执行 4:2:0 色度二次采样(颜色压缩)。
第一步是确保我可以生成 Y、Cb 和 Cr 值,然后转换回 RGB 并显示图像。然后我可以回去添加我的子采样逻辑。
我很确定我有正确的公式来生成 Y、Cb 和 Cr 值,但我无法找出返回 RGB 和打印的正确方法。
我们不允许使用任何内置函数(这通常会出现在帮助解决这个问题的过程中)。
我附上了如何获取 Y Cb 和 Cr 值以及如何尝试恢复 RGB 的代码。
目前,在这段摘录之后在 newImage 上运行“imshow”时出现绿屏。
orig 是原始图像,newImage 是我在这段摘录之后运行的“imshow”。
python - 获取numpy数组元素的所有可能组合
我需要获取 numpy 数组所有可能大小的所有可能组合 nCr。
应该给我们一组数组:
有没有聪明的方法来做到这一点?
为方便起见,可以执行所有固定长度的数组 (5):[1,0,0,0,0]、[2,0,0,0,0] 等
r - 变长df二次采样函数r
n
我需要编写一个函数,涉及通过变量bin对 df 进行子集。就像,如果n
是 2,则在两个 bin 中对 df 进行多次二次采样(从前半部分开始,然后从后半部分开始)。如果n
为 3,则在 3 个 bin(第一个 1/3、第二个 1/3、第三个 1/3)中进行子采样。到目前为止,我一直在手动为不同长度的 n 执行此操作,并且我知道必须有更好的方法来执行此操作。我想把它写成一个n
作为输入的函数,但到目前为止我还不能让它工作。代码如下。
这个df是46年的采样。我想假装不是 46 个样本,我只取了 2 个,但在上半年(1:23)随机一年,在下半年(24:46)随机一年。
(如果我们可以让它跳过“NA”样本年份的样本,那就太好了)。
所以,如果我想为三点而不是两点执行此操作,我会重复这样的过程:
但是,我想这样做很多次,最多采样 20 次(所以在 20 个 bin 中),所以这种手动方法是不可持续的。你能帮我写一个函数说“从n个箱子中挑选一个样本x次”吗?
顺便说一句,这是我用完整的df制作的情节:
python - Gensim word2vec 下采样样本=0
在 Gensim word2vec 中是否sample= 0
意味着在我的训练期间没有使用下采样?文档就是这么说的
“有用的范围是 (0, 1e-5)”
但是将阈值设置为 0 会导致 P(wi) 等于 1,这意味着不会丢弃任何单词,我是否理解正确?
我正在处理一个包含 7597 个 Facebook 帖子(18945 个单词)的相对较小的数据集,并且我的嵌入sample= 0
在推荐范围内的使用效果要好得多。有什么特别的原因吗?字体大小?
python - 对一维整数数组进行二次采样,以便总和达到 python 中的目标值
我有两个整数的一维数组,它们有些不同,例如:
我希望每个数组的总和等于两者中最小的数组的总和。但是我想将值保留为整数,而不是浮点数,所以除法不是一种选择。解决方案似乎是对最大数组进行一些子采样,使其总和等于最小数组的总和:
但是,我找不到可以执行这种二次采样的函数。我发现的唯一一个是 scipy,但它们似乎专门用于处理音频信号。替代方案是scikit-bio 包的一个功能,但它不适用于 Python 3.7。