“subsampling”的相关标签问题

0 投票

1 回答

510 浏览

h2o - 是否有一种“简单”的方法可以使用 h2o.ai 创建分层的帧分割？

分层抽样很古老，而且非常重要。

Donald Knuth（计算机科学的大祭司）用它来评估他的博士生的工作，并教授他深刻而真诚的宗教信仰。（链接）
皇家学会 1934 年关于该主题的文章。（链接）

在 h2o.ai 的 r 接口中，他们有一种方法来分割帧“h2o.splitframe”。有没有办法沿着另一列的不同元素进行分层拆分？

以下是在 h2o 中不执行此操作的 R 包：

https://www.rdocumentation.org/packages/fifer/versions/1.0/topics/stratified

h2o subsampling

2019-11-22T15:34:23.593

0 投票

1 回答

351 浏览

gensim - Gensim 如何在 Word2Vec 中实现子采样？

我正在尝试在 pytorch 中重新实现 wor2vec。我根据原论文的代码实现了二次采样。但是，我试图了解如何在 Gensim 中实现子采样。我查看了源代码，但我没有掌握它是如何重新连接到原始论文的。

提前非常感谢。

2019-11-23T16:19:38.413

0 投票

1 回答

1480 浏览

ffmpeg - 使用 ffmpeg 进行色度二次采样

我想创建一个 .mp4 输出。但它不起作用...

我正在使用 ffmpeg。我的输入视频是原始视频，我希望最后有一个原始视频 .mp4。

我使用的代码：

谁能帮我吗？:)

ffmpeg output mp4 subsampling

2019-11-25T16:04:29.593

0 投票

1 回答

175 浏览

python - 为矩形图像创建重叠的方形补丁

给定一个矩形图像img和补丁s。现在我想用边长的正方形补丁覆盖整个图像s，以便img使用最少数量的补丁，其中的每个像素都在至少一个补丁中。此外，我希望相邻的补丁尽可能少地重叠。

到目前为止：我在下面包含了我的代码并制定了一个示例。但是它还不能完美地工作。希望有人发现错误。

示例：Given is imgof shape：这意味着我将在较长的一侧放置 21 个补丁，在宽度较小的一侧放置 14 个补丁，总共 21*14 = 294 个补丁(4616, 3016)。s = 224

现在我试图弄清楚补丁如何分配补丁之间的重叠。我的补丁可以覆盖 size: 的图像(4704, 3136)，因此我的高度必须覆盖 88 个重叠像素missing_h = ht * s - h，宽度类似。

现在我试着弄清楚，如何在 21 个补丁上分配 88 个像素。88 = 4* 21 + 4 因此，我将有hso = 17重叠 shso = 4的hbo = 4补丁和重叠 5 的补丁，宽度是类似的。

现在我只需遍历整个图像并跟踪我当前的位置(cur_h, cur_w)。在我调整每个循环之后，cur_h, cur_w. 我有s，我当前的补丁号i, j，它表明补丁是否有小或大的重叠。

python image-processing sampling subsampling

2019-12-14T21:01:24.840

0 投票

1 回答

1513 浏览

matlab - 在 Matlab 中，当图像在 YCbCr 中时，如何使用色度二次采样将 4:4:4 图像缩小到 4:2:0？

我已经将 jpg 图像从 RGB 转换为 YCbCr，但现在必须使用 Chroma Subsampling 使它们成为 4:2:0。我已经搜索但没有找到有关如何执行此操作的任何信息（注意：我对 Matlab 很陌生）

编辑：我现在有了这个，但是在我设置 ycbcr(:,:,2) = newCb 的底部它说“无法执行分配，因为左侧的大小是 1273-by-1910 和右侧的大小边是 1273×955×0。”

matlab multimedia subsampling

2020-02-17T23:10:57.293

0 投票

1 回答

558 浏览

matlab - 如何在 MATLAB 中手动将 Y Cb Cr 转换为 RGB？

我的任务是对一系列 JPEG 执行 4:2:0 色度二次采样（颜色压缩）。

第一步是确保我可以生成 Y、Cb 和 Cr 值，然后转换回 RGB 并显示图像。然后我可以回去添加我的子采样逻辑。

我很确定我有正确的公式来生成 Y、Cb 和 Cr 值，但我无法找出返回 RGB 和打印的正确方法。
我们不允许使用任何内置函数（这通常会出现在帮助解决这个问题的过程中）。

我附上了如何获取 Y Cb 和 Cr 值以及如何尝试恢复 RGB 的代码。
目前，在这段摘录之后在 newImage 上运行“imshow”时出现绿屏。

orig 是原始图像，newImage 是我在这段摘录之后运行的“imshow”。

matlab colors rgb subsampling ycbcr

2020-02-26T06:06:38.137

0 投票

0 回答

31 浏览

python - 获取numpy数组元素的所有可能组合

我需要获取 numpy 数组所有可能大小的所有可能组合 nCr。

应该给我们一组数组：

有没有聪明的方法来做到这一点？

为方便起见，可以执行所有固定长度的数组 (5)：[1,0,0,0,0]、[2,0,0,0,0] 等

python arrays numpy combinations subsampling

2020-02-27T09:39:49.477

0 投票

2 回答

75 浏览

n我需要编写一个函数，涉及通过变量bin对 df 进行子集。就像，如果n是 2，则在两个 bin 中对 df 进行多次二次采样（从前半部分开始，然后从后半部分开始）。如果n为 3，则在 3 个 bin（第一个 1/3、第二个 1/3、第三个 1/3）中进行子采样。到目前为止，我一直在手动为不同长度的 n 执行此操作，并且我知道必须有更好的方法来执行此操作。我想把它写成一个n作为输入的函数，但到目前为止我还不能让它工作。代码如下。

这个df是46年的采样。我想假装不是 46 个样本，我只取了 2 个，但在上半年（1:23）随机一年，在下半年（24:46）随机一年。

（如果我们可以让它跳过“NA”样本年份的样本，那就太好了）。

所以，如果我想为三点而不是两点执行此操作，我会重复这样的过程：

但是，我想这样做很多次，最多采样 20 次（所以在 20 个 bin 中），所以这种手动方法是不可持续的。你能帮我写一个函数说“从n个箱子中挑选一个样本x次”吗？

顺便说一句，这是我用完整的df制作的情节：

r function dplyr subset subsampling

2020-03-24T11:15:59.083

0 投票

1 回答

573 浏览

python - Gensim word2vec 下采样样本=0

在 Gensim word2vec 中是否sample= 0意味着在我的训练期间没有使用下采样？文档就是这么说的

“有用的范围是 (0, 1e-5)”

但是将阈值设置为 0 会导致 P(wi) 等于 1，这意味着不会丢弃任何单词，我是否理解正确？

我正在处理一个包含 7597 个 Facebook 帖子（18945 个单词）的相对较小的数据集，并且我的嵌入sample= 0在推荐范围内的使用效果要好得多。有什么特别的原因吗？字体大小？

python math gensim word-embedding subsampling

2020-03-30T19:42:38.263

0 投票

1 回答

62 浏览

python - 对一维整数数组进行二次采样，以便总和达到 python 中的目标值

我有两个整数的一维数组，它们有些不同，例如：

我希望每个数组的总和等于两者中最小的数组的总和。但是我想将值保留为整数，而不是浮点数，所以除法不是一种选择。解决方案似乎是对最大数组进行一些子采样，使其总和等于最小数组的总和：

但是，我找不到可以执行这种二次采样的函数。我发现的唯一一个是 scipy，但它们似乎专门用于处理音频信号。替代方案是scikit-bio 包的一个功能，但它不适用于 Python 3.7。

python arrays subsampling

2020-04-21T10:01:19.000

问题标签 [subsampling]

h2o - 是否有一种“简单”的方法可以使用 h2o.ai 创建分层的帧分割？

gensim - Gensim 如何在 Word2Vec 中实现子采样？

ffmpeg - 使用 ffmpeg 进行色度二次采样

python - 为矩形图像创建重叠的方形补丁

matlab - 在 Matlab 中，当图像在 YCbCr 中时，如何使用色度二次采样将 4:4:4 图像缩小到 4:2:0？

matlab - 如何在 MATLAB 中手动将 Y Cb Cr 转换为 RGB？

python - 获取numpy数组元素的所有可能组合

r - 变长df二次采样函数r

python - Gensim word2vec 下采样样本=0

python - 对一维整数数组进行二次采样，以便总和达到 python 中的目标值

问题标签 [subsampling]

Reference