我需要帮助开始使用 libsndfile。
我有四个 .wav 文件(所有相同的采样率)。
我想把前两个一起加入,然后接下来的两个一起,
然后将生成的 2 个 .wav 文件混合为一个。
我需要帮助开始使用 libsndfile。
我有四个 .wav 文件(所有相同的采样率)。
我想把前两个一起加入,然后接下来的两个一起,
然后将生成的 2 个 .wav 文件混合为一个。
用于混合两个 wav 文件。
#include <cstdio>
#include <sndfile.h>
#include <windows.h>
#include <cstdlib>
#include <cmath>
#define BUFFER_LEN 1024
#define MAX_CHANNELS 6
static void data_processing (double *data, int count, int channels) ;
int main (void) {
static double data [BUFFER_LEN] ;
static double data2 [BUFFER_LEN] ;
static double outdata [BUFFER_LEN] ;
SNDFILE *infile, *outfile, *infile2 ;
SF_INFO sfinfo ;
int readcount ;
SF_INFO sfinfo2 ;
int readcount2 ;
const char *infilename = "inputOne.wav" ;
const char *infilename2 = "inputTwo.wav" ;
const char *outfilename = "output.wav" ;
if (! (infile = sf_open (infilename, SFM_READ, &sfinfo))) {
/* Open failed so print an error message. */
printf ("Not able to open input file %s.\n", infilename) ;
/* Print the error message from libsndfile. */
puts (sf_strerror (NULL)) ;
return 1 ;
} ;
if (sfinfo.channels > MAX_CHANNELS) {
printf ("Not able to process more than %d channels\n", MAX_CHANNELS) ;
return 1 ;
} ;
if (! (infile2 = sf_open (infilename2, SFM_READ, &sfinfo2))) {
/* Open failed so print an error message. */
printf ("Not able to open input file %s.\n", infilename2) ;
/* Print the error message from libsndfile. */
puts (sf_strerror (NULL)) ;
return 1 ;
} ;
if (sfinfo2.channels > MAX_CHANNELS) {
printf ("Not able to process more than %d channels\n", MAX_CHANNELS) ;
return 1 ;
} ;
/* Open the output file. */
if (! (outfile = sf_open (outfilename, SFM_WRITE, &sfinfo))) {
printf ("Not able to open output file %s.\n", outfilename) ;
puts (sf_strerror (NULL)) ;
return 1 ;
} ;
while ((readcount = sf_read_double (infile, data, BUFFER_LEN)) &&
(readcount2 = sf_read_double (infile2, data2, BUFFER_LEN))) {
data_processing (data, readcount, sfinfo.channels) ;
data_processing(data2, readcount2, sfinfo2.channels) ;
for(int i=0; i < 1024;++i) {
outdata[i] = (data[i] + data2[i]) -(data[i])*(data2[i])/65535;
}
sf_write_double (outfile, outdata , readcount) ;
} ;
/* Close input and output files. */
sf_close (infile) ;
sf_close (infile2) ;
sf_close (outfile) ;
system("PAUSE");
return 0 ;
} /* main */
static void data_processing(double *data, int count, int channels) {
double channel_gain [MAX_CHANNELS] = { 0.5, 0.8, 0.1, 0.4, 0.4, 0.9 } ;
int k, chan ;
for (chan = 0 ; chan < channels ; chan ++)
for (k = chan ; k < count ; k+= channels)
data [k] *= channel_gain [chan] ;
return ;
} /* data_processing */
这就是我混合两个简单的 16 位信号的 wav 文件的方式。
首先,音频混合并不像人们想象的那样容易。加入两个信号后可能会有很多歧义。在我的情况下,它工作得很好,就像我需要它一样,但是如果你需要精确的结果,你可能需要更多地搜索谷歌以获得精确的相互叠加的信号。
要加入两个 wav 文件,您只需读取第一个 wav 文件,复制结果 wav 文件中的数据,最后将第二个 wav 文件的数据附加到结果 wav 文件中。
此链接也可能对您有用 http://www.vttoth.com/digimix.htm
这是旧的,但我正在阅读它,所以其他人不可避免地会这样做。
关于 libsndfile 的使用,我基本同意 nishantmishra 的看法,但是如果按照作者的预期,这种混合算法会导致一定程度的失真:
outdata[i] = (data[i] + data2[i]) -(data[i])*(data2[i])/65535;
(实际上,最后一个术语只增加了一点低级噪音......在阅读 V-Toth 的文章之前,我认为这是一种有趣的抖动形式),假设这是以一种按预期工作的方式应用的(浮动点音频的范围从 -1.0 到 1.0,因此除以 65535 会将乘积减少 96 dB,这使得 16 位音频听不见)。如果您真的想实现此方法,请继续阅读 V Toth 的帖子,了解如何为签名数据执行此操作。
无论有符号还是无符号,您都将添加互调失真(即使听起来不难听,它也会存在)。换句话说,这对于语音或低比特率(电话)音频非常有用,其中传输通道中的失真远远超过通道乘积所增加的互调失真。
如果您只是处理两个文件,而不是实时处理(在从文件或流中读取块时播放),您可以对两个文件进行归一化,应用混合增益,使 gain1+gain2 = 1.0,然后求和他们在一起。V Toth 提到的这些低分辨率挑战对于 32 位浮点或 64 位双精度来说并不是一个大问题。
最后,如果您担心一个音源太安静而另一个无声,那么您可以应用与另一个通道交叉链接的动态范围压缩器。另一种策略是应用相同的算法,但应用于音频的包络,而不是单个样本:
outEnvelope[i] = (envelope1[i] + envelope2[i]) \
-(envelope1[i])*(envelope2[i]);
outdata[i]=outEnvelope[i]*(data[i] + data2[i]);
其中信封 =
envelope1[i]=sqrt(lowPassFilter(data[i]*data[i]));//moving RMS representation
低通滤波器的截止频率约为 <10Hz,以最大限度地减少谐波失真。
真的,我认为你最想做的就是放弃最后一个术语并使用这一行:
outdata[i] = (data[i] + data2[i]);
只要channel_gain[]之和=1.0,就会得到一个不错的结果。nishantmishra 的代码运行良好,因为最后一个添加失真的项被降低到本底噪声,因此您不妨节省 CPU 时间并消除它。