问题标签 [subsampling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2646 浏览

r - 下采样数据集

我有一个数据集,它是一个大字符向量(1,024,459 个元素),由基因 ID 组成。看起来像:

其中每个基因 ID 重复它在 RNA seq 运行中看到的次数(所以在这里,基因“1”有 7 个读数,基因“10”有 2 个读数)。我想以 10,000 个读取间隔绘制每个读取次数识别的基因数量,以便我可以看到如果我随机采样 10,000 个读取、20,000、30,0000 等,我可以看到有多少基因被识别出来。我制作了一个间距向量seq() 函数如下:

但我不确定如何将其应用于我的 allres 矢量并绘制它。非常感谢任何帮助。

0 投票
1 回答
1126 浏览

video-processing - UYVY (YUV 4:2:2, Y422, UYNV, HDYC) 颜色系统如何处理奇数像素数?

根据我一直在阅读的参考资料,一些平面 YUV 格式(例如 UYVY)使用包含多个像素数据的宏像素 - 具体而言,在 UYVY 的情况下,每个像素的亮度值以及每隔一个水平像素的 U 和 V 样本.

我没有看到描述的是,当尺寸不能被 2 整除时,视频应该使用什么值。例如,如果帧的像素宽度为奇数,则每行上的最后一个宏像素是否应该换行到下一行,或者是否应该在解码期间假定第二个 Y 值被忽略?Y 值应该设置为多少(例如零)是否有标准?

如果宏像素确实换行,那么最终宏像素在具有奇数像素数的帧大小(例如 51x51)中应该是什么情况?

0 投票
1 回答
808 浏览

jpeg - 解释从文件中读取的 JPEG Chroma Subsampling

我试图找出图片是由哪个 MCU(8x8、16x8 和 16x16)制成的。为此,我解析了存储色度二次采样因子的帧开始 (SOFn) 标记。我找到了以下内容:

我对如何解释它感到困惑。读到这里我开始相信 1x1 代表 4:4:4 采样,因此导致 8x8 像素 MCU,2x1 代表 4:2:2 -> 16x8 像素 MCU,2x2 代表 4:2:0 -> 16x16 pixl MCU .

每个采样率都决定了组件如何存储在熵编码数据中,从而导致 MCU。但是现在每个分量(Y、Cb、Cr)都有自己的子采样率。

如何解释我从 JPEG 标记中读取的日期,以判断整个图像中使用了哪个 MCU?

0 投票
1 回答
204 浏览

sampling - 基于 r 中唯一 ID 的采样

我有 7500 条消息,每条消息都有对应的唯一 ID 号。我已将消息分成季节,并有一个季节消息块:2013 年冬季 ----> 2014 年春季。我希望创建一个代表整个时期的 1000 条消息的样本,所以我将从 5 个赛季中的每个赛季中获取 200 条消息。

我使用以下代码对唯一 ID 进行了采样:

然后我使用以下代码将它们附加到长度为 1000 的一个因子中:

现在我想检索与这些 ID 对应的消息。我正在使用以下代码,但这不起作用。

我究竟做错了什么?

0 投票
1 回答
1999 浏览

r - 从 R 中的大型 .CSV 导入和提取随机样本

我在 R 中做一些分析,我需要处理一些大型数据集(10-20GB,存储在 .csv 中,并使用 read.csv 函数)。

由于我还需要将大型 .csv 文件与其他数据帧合并和转换,因此我没有计算能力或内存来导入整个文件。

我想知道是否有人知道导入随机百分比的 csv 的方法。

我已经看到了一些示例,其中人们导入了整个文件,然后使用单独的函数创建了另一个数据框,该数据框是原始样本的示例,但是我希望一些不那么密集的东西。

0 投票
1 回答
48 浏览

python - python2.6中子样本0.0.6的错误

我正在尝试在 python2.6.6 中运行 subsample0.0.6 包(以便能够在 python 中运行类似 "> subsample -n 1000 big_data.csv" 的东西)

在安装 subsample 之后,在我检查“import subsample”之后它似乎首先工作,但是当我移动到不同的目录并尝试运行命令时,我得到一个错误。谁能告诉我发生了什么,或者我应该从这里做什么?

[GCC 4.4.7 20120313 (Red Hat 4.4.7-4)] 在 linux2 上键入“帮助”、“版权”、“信用”或“许可证”以获取更多信息。

导入 subsample Traceback(最近一次调用最后一次):文件“”,第 1 行,在文件“subsample.py”中,第 4 行,infraction = float(sys.argv[1]) IndexError: list index out of range

0 投票
0 回答
1390 浏览

python - 二次采样和缩小(图像)之间的区别?

我知道有很多方法可以使用双线性、双三次等来放大(插值)图像……不知何故,这些相同的算法也可用于缩小图像。但是当涉及到二次采样时,我只遇到了两种方法:高斯模糊然后丢弃一些行和列,或者块平均。

是否有双线性,双三次,......子采样之类的东西?

而不是高斯模糊然后丢弃或块平均,我可以/应该做高斯模糊然后块平均吗?或双线性,双三次,......如果有这样的事情的话?

我正在做的是尝试制作图像高斯和拉普拉斯金字塔;但我不确定如何抽取和插入图像。一些带有 Scipy/Numpy 的 Python 代码真的很有帮助。非常感谢。

0 投票
3 回答
842 浏览

matlab - 子采样后将图像大小调整为原始大小

我正在使用 matlab 对图像进行二次采样。但我有一项任务是将二次采样图像重置为原始大小。我已经用最近邻近似和平均相邻像素来完成它,这工作正常。有没有其他算法可以做到这一点?

提前致谢。

0 投票
2 回答
736 浏览

android - 图像的android位图二次采样

在 SD 卡的列表视图中显示图像时出现内存不足错误的问题

我知道这是因为我需要对位图进行二次采样,因为它们是 8mp 大图片,如果我将它们缩小到 600 x 450,它们会完美加载

我使用以下方法正常加载它们

正如我所说,如果我使用全尺寸图像,这会使应用程序崩溃

我有以下两种方法可以对位图进行二次采样

}

问题是我不知道如何调用它所以它显示

这是我填充列表视图的方法

它似乎在加载列表视图时起作用,并且每个项目上的所有文本都在那里,但图像是空白的

任何想法我哪里出错了?

任何帮助表示赞赏

标记

0 投票
2 回答
1180 浏览

r - 使用 R 循环计算随机子样本的统计数据

我试图在 R 中找到一种方法来随机子集一些数据(生态研究区域中合适栖息地的比例),计算值 > 0 的样本的平均值和比例,然后将这些值保存或附加到数据框中。然后我想重复多次(例如 1000 次)。标准引导或重采样包不起作用,因为我需要计算发生频率以及子样本的平均值。我知道“应用”函数,但是这些函数会在整个数据帧上循环,而我试图在重复的子样本上执行它。我知道我需要一些代码来获取循环中的计算值以保存和输出但有问题。“habprop”是数据框(“数据”)中的一列,我想计算并保存正值的平均值和比例。