问题标签 [dct]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
math - vhdl 中 2d dct 中的 cosblock
我在 vhdl 中搜索了 2d dct 实现,我发现一些代码因为它们使用了类型 RF 是 INTEGER 的数组(0 到 7、0 到 7);常数 cosblock:RF:=(
我的问题是如何计算这个 cosblock 值。我知道浮点数中的 dct 系数,但这是整数,那么这是如何计算的?请指导
matlab - 在 Matlab 中使用 dct 后将向量转换为二进制字符串
我正在使用 dct 转换频域中的向量(该向量可以是来自较大矩阵的 8x8 窗口的一行)我希望后记能够在类似于 jpeg 压缩的过程中量化该向量,因为 dct 返回浮点数这对我进行任何进一步的操作没有帮助。非常感谢有关如何完成此操作的任何帮助
谢谢。
performance - 快速 dct 算法的错误结果
我想通过 VHDL 实现 Loeffler 快速 dct 算法。在此之前,我检查了给定数据的算法结果,如下所示:
然后我使用这个算法计算了 dct 等效值,结果如下:
但是matlab的结果是这样的:
y=dct(x)
y =
第 1 至 6 列
第 7 至 8 列
我的错误是什么?
谢谢
image - 使用 DCT 系数更改图像亮度和对比度
我正在尝试在频域中执行一些图像转换(使用 dct coeff),例如调整灰度图像的亮度和对比度。到目前为止我所知道的是,调整亮度意味着向像素强度添加偏移量,而调整对比度是将每个像素乘以一个值。我的问题是这在频域中是否仍然可用?
当我这样做时,图像没有明显的差异,即使值有点高。但是,如果我不是按块执行,而是对完整图像的 coef 执行
差异很明显。
我究竟做错了什么?是我选择相加和相乘的值(完全随机)的方式吗?我还想提一下,如果我从 idct 添加偏移伪影,输出中会出现(每个块的前 3 个左上角像素与其他像素完全不同)。
我知道每个 dct 块的左上角值具有块的亮度平均值。我应该只修改这个而不修改其他值吗?块大小如何影响结果?
math - 将浮点数转换为整数
如何缩放以及通过哪个因子从浮点缩放 dctmtx 系数以获得以下整数值:
浮动 dctmtx:
整数 dctmtx:
c++ - 使用 OpenCV 和 C++ 将图像帧拆分为 8*8 用于 DCT
我需要将 fullPath 传递给方法 FrameTo8by8()。在 FrameTo8by8() 中,它将每一帧分割成 8*8 块。(例如,我的视频分辨率是 1280*720 = 921,600。之后是 921,600 / 64(8*8) = 14,400。所以总共会有 14,400 个 8*8 的块)。
VideoSplitEngine.h
VideoSplitEngine.cpp
我需要有关如何拆分它的帮助,还是有其他方法可以做到这一点?
image - 关于用于图像压缩的 Jpeg 压缩系数
在我的工作中使用 JPEG 8*8 压缩系数表。谁能帮我知道这些系数是如何得出的?公式?还有 4*4 系数和 16*16 系数呢?
jpeg - Java中有没有类似的libjpeg API?
我正在处理一个需要我读取 JPEG 图像并检索其 DCT 系数的项目。我会用Java来做。
了解非常有用的 libjpeg API,可用于直接访问图像的 DCT(与 MATLAB 中的 jpeg 工具箱一起使用)
Java中是否有类似的API?
audio - 使用 MFCC 和 DTW 进行广告检测
我正在做一个项目,通过使用广告的剪辑片段(口号)检测传输中的广告,基于如下查看音轨:
音频信号->帧->窗口-> FFT(快速傅立叶变换)- -> DCT(离散余弦变换)-> MFCC(梅尔频率倒谱系数)-> DTW(动态时间规整)。为此,我使用 MFCC作为音频功能,DTW(动态时间扭曲)用于比较音频帧和帧之间的欧几里德距离的平均值,以计算扭曲距离。然后翘曲距离除以要计算的总帧数MSE(均方误差),根据阈值 1 检查。
我的算法无法检测来自嘈杂传输的广告和相同标语的不同广告。我是否对这种类型的音频检测使用了正确的方法?还有其他更合适的方法吗?如果需要,你能建议我任何好的信号预过滤吗?
image-processing - 使用 JAI TiledImage 将图像划分为 8x8 块
我在一个需要我检索图像的 DCT 系数数组的项目中。我正在使用 JAI 并设法使用 API 计算 DCT。但是,计算的 DCT 应用于整个图像,而不是像我想要的那样在块中。
如何在块的基础上应用 DCT 计算,意思是说如何使用 TiledImage 类将图像划分为 8x8 的块,并在可能的情况下访问每个块的 DCT?