问题标签 [dct]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
100 浏览

math - vhdl 中 2d dct 中的 cosblock

我在 vhdl 中搜索了 2d dct 实现,我发现一些代码因为它们使用了类型 RF 是 INTEGER 的数组(0 到 7、0 到 7);常数 cosblock:RF:=(

我的问题是如何计算这个 cosblock 值。我知道浮点数中的 dct 系数,但这是整数,那么这是如何计算的?请指导

0 投票
1 回答
619 浏览

matlab - 在 Matlab 中使用 dct 后将向量转换为二进制字符串

我正在使用 dct 转换频域中的向量(该向量可以是来自较大矩阵的 8x8 窗口的一行)我希望后记能够在类似于 jpeg 压缩的过程中量化该向量,因为 dct 返回浮点数这对我进行任何进一步的操作没有帮助。非常感谢有关如何完成此操作的任何帮助

谢谢。

0 投票
2 回答
167 浏览

performance - 快速 dct 算法的错误结果

我想通过 VHDL 实现 Loeffler 快速 dct 算法。在此之前,我检查了给定数据的算法结果,如下所示:

然后我使用这个算法计算了 dct 等效值,结果如下:

但是matlab的结果是这样的:

y=dct(x)

y =

第 1 至 6 列

第 7 至 8 列

我的错误是什么?

谢谢

0 投票
1 回答
1784 浏览

image - 使用 DCT 系数更改图像亮度和对比度

我正在尝试在频域中执行一些图像转换(使用 dct coeff),例如调整灰度图像的亮度和对比度。到目前为止我所知道的是,调整亮度意味着向像素强度添加偏移量,而调整对比度是将每个像素乘以一个值。我的问题是这在频域中是否仍然可用?

当我这样做时,图像没有明显的差异,即使值有点高。但是,如果我不是按块执行,而是对完整图像的 coef 执行

差异很明显。

我究竟做错了什么?是我选择相加和相乘的值(完全随机)的方式吗?我还想提一下,如果我从 idct 添加偏移伪影,输出中会出现(每个块的前 3 个左上角像素与其他像素完全不同)。

我知道每个 dct 块的左上角值具有块的亮度平均值。我应该只修改这个而不修改其他值吗?块大小如何影响结果?

0 投票
2 回答
294 浏览

math - 将浮点数转换为整数

如何缩放以及通过哪个因子从浮点缩放 dctmtx 系数以获得以下整数值:

浮动 dctmtx:

整数 dctmtx:

0 投票
1 回答
3147 浏览

c++ - 使用 OpenCV 和 C++ 将图像帧拆分为 8*8 用于 DCT

我需要将 fullPath 传递给方法 FrameTo8by8()。在 FrameTo8by8() 中,它将每一帧分割成 8*8 块。(例如,我的视频分辨率是 1280*720 = 921,600。之后是 921,600 / 64(8*8) = 14,400。所以总共会有 14,400 个 8*8 的块)。

VideoSplitEngine.h

VideoSplitEngine.cpp

我需要有关如何拆分它的帮助,还是有其他方法可以做到这一点?

0 投票
1 回答
25 浏览

image - 关于用于图像压缩的 Jpeg 压缩系数

在我的工作中使用 JPEG 8*8 压缩系数表。谁能帮我知道这些系数是如何得出的?公式?还有 4*4 系数和 16*16 系数呢?

0 投票
1 回答
862 浏览

jpeg - Java中有没有类似的libjpeg API?

我正在处理一个需要我读取 JPEG 图像并检索其 DCT 系数的项目。我会用Java来做。

了解非常有用的 libjpeg API,可用于直接访问图像的 DCT(与 MATLAB 中的 jpeg 工具箱一起使用)

Java中是否有类似的API?

0 投票
0 回答
222 浏览

audio - 使用 MFCC 和 DTW 进行广告检测

我正在做一个项目,通过使用广告的剪辑片段(口号)检测传输中的广告,基于如下查看音轨:
音频信号->帧->窗口-> FFT(快速傅立叶变换)- -> DCT(离散余弦变换)-> MFCC(梅尔频率倒谱系数)-> DTW(动态时间规整)。为此,我使用 MFCC作为音频功能,DTW(动态时间扭曲)用于比较音频帧和帧之间的欧几里德距离的平均值,以计算扭曲距离。然后翘曲距离除以要计算的总帧数MSE(均方误差),根据阈值 1 检查。

我的算法无法检测来自嘈杂传输的广告和相同标语的不同广告。我是否对这种类型的音频检测使用了正确的方法?还有其他更合适的方法吗?如果需要,你能建议我任何好的信号预过滤吗?

0 投票
0 回答
119 浏览

image-processing - 使用 JAI TiledImage 将图像划分为 8x8 块

我在一个需要我检索图像的 DCT 系数数组的项目中。我正在使用 JAI 并设法使用 API 计算 DCT。但是,计算的 DCT 应用于整个图像,而不是像我想要的那样在块中。

如何在块的基础上应用 DCT 计算,意思是说如何使用 TiledImage 类将图像划分为 8x8 的块,并在可能的情况下访问每个块的 DCT?