我正在写一篇关于和弦检测的论文。经过努力,我发现问题的根源在于使用基于 C# 的程序获取 wav 文件的幅度。
我用这个代码来检索幅度:
public WavProcessing(String fileNameWithPath)
{
_fileNameWithPath = fileNameWithPath;
}
public void Initialization()
{
AssignWaveHeaderData();
streamBuffer = File.ReadAllBytes(_fileNameWithPath);
fftBufferSize = 16384;
fftBufferSize2 = fftBufferSize / 2;
}
private void getAmplitude()
{
waveData = new short[numOfSamples];
var xsample = new short[numOfSamples];
var x = 0;
var str = "";
for (var i = 44 ; i <= waveData.Length; i = i + 2) //44 because the wave data starts at 44th byte.
{
waveData[x] = BitConverter.ToInt16(streamBuffer,i);
x++;
}
}
代码起初运行良好,我将它与基于 delphi 的程序进行了比较,该程序也是一个和弦检测程序。但我没有注意到的是,我的代码实际上只检索了一半的振幅数组。
例如:我将 Chord C wav 文件加载到我的 C# 程序中,我得到了这样的振幅数组
[0] -279
[1] -262
[2] -231
[3] -216
[4] -199
[5] -185
[6] -178
[7] -186
[8] -217
[9] -237
[10] -267
[11] -298
[12] -319
[13] -348
[14] -374
[15] -373
[16] -376
[17] -366
[18] -357
[19] -340
[20] -319
[21] -312
[22] -300
[23] -301
[24] -308
[25] -321
[26] -339
...
[361042] 1950
[361043] 0
[361044] 0
...
[722128] 0
你可以看到开始 361043-rd 数组,它只返回零......它大约只有完整流大小的一半(722128)
同时在某人的delphi程序中(我以此作为参考),其代码如下:
procedure TForm1.openfilewave(NamaFile : string);
var
Stream : TFileStream;
i, start, endwave : Integer;
begin
Application.ProcessMessages;
Stream := TFileStream.Create(FileName, fmOpenRead);
FillChar(wavehdr, SizeOf(wavehdr), 0);
Stream.Read(wavehdr, SizeOf(wavehdr));
SetLength(wavedata[0].Data, Round(wavehdr.chunkSize/wavehdr.BytesPerSample));
for i := 0 to High(wavedata[0].Data) do
begin
Stream.Read(wavedata[0].Data[i], 2);
end;
end;
返回完整的振幅数组(相同的 wav 文件),例如:
0 -- -279
1 -- -262
2 -- -231
3 -- -216
4 -- -199
5 -- -185
6 -- -178
7 -- -186
8 -- -217
9 -- -237
10 -- -267
11 -- -298
12 -- -319
13 -- -348
14 -- -374
15 -- -373
16 -- -376
17 -- -366
18 -- -357
19 -- -340
20 -- -319
...
361042 -- 1950
361043 -- 1819 << not returning zero value
361044 -- 1655
361045 -- 1476
...
722100 -- 165
722101 -- 142
722102 -- 117
722103 -- 91
722104 -- 68
722105 -- 37
722106 -- 11
722107 -- -6
722108 -- -27
722109 -- -36
722110 -- 0
722111 -- 0
...
722128 -- 0
在那个 delphi 程序中,返回完整的振幅数组,为下一次计算产生正确的值。