2

我编写了一个算法来从 AMR 文件中提取每一帧。我认为文件的前 6 个字节是标题,以下信息是音频帧。每个音频帧由帧头和音频数据组成。帧头以字节为单位告知帧的大小(使用 CMR 模式表 - http://www.developer.nokia.com/Community/Wiki/AMR_format)。帧大小存储在帧的第一个字节 -> 第二位到第 5 位,将 MSB 计为第一位。

该算法不起作用,我决定以二进制方式(0 和 1)在屏幕上显示每个字节,看起来有时帧大小号大于 7,而 CMR 表只有 0...7 个值。

下面是 CMR 表:

CMR      MODE        FRAME SIZE( in bytes )
0 AMR    4.75        13
1 AMR    5.15        14
2 AMR    5.9         16
3 AMR    6.7         18
4 AMR    7.4         20
5 AMR    7.95        21
6 AMR    10.2        27
7 AMR    12.2        32

我的输出(来自 amr 文件的每个字节)是:

0 -> 0 0 0 0 0 0 0 0 
1 -> 0 0 0 0 0 0 0 0 
2 -> 0 0 0 0 0 0 0 0 
3 -> 0 0 0 1 1 0 0 0 
4 -> 0 1 1 0 0 1 1 0 
5 -> 0 0 1 0 1 1 1 0 
6 -> 1 0 0 1 1 1 1 0 
7 -> 0 0 0 0 1 1 1 0 
8 -> 1 1 0 0 1 1 0 0 
9 -> 1 1 1 0 0 1 1 0 
10 -> 0 0 0 0 1 1 1 0 
11 -> 0 0 1 0 1 1 0 0 
12 -> 0 0 0 0 0 0 0 0 
13 -> 0 0 0 0 0 0 0 0 
14 -> 0 0 0 0 0 0 0 0 
15 -> 0 0 0 0 0 0 0 0 
16 -> 1 0 0 1 0 1 1 0 
17 -> 1 1 0 0 1 1 1 0 
18 -> 1 1 1 1 0 1 1 0 
19 -> 1 0 1 1 0 1 1 0 
20 -> 1 1 0 0 1 1 0 0 
21 -> 1 1 1 0 0 1 1 0 
22 -> 0 0 0 0 1 1 1 0 
23 -> 0 0 1 0 1 1 0 0 
24 -> 0 0 0 0 0 0 0 0 
25 -> 0 0 0 0 0 0 0 0 
26 -> 0 1 0 0 0 0 0 0 
27 -> 1 0 0 1 1 0 0 0 
28 -> 1 0 1 1 0 1 1 0 
29 -> 1 1 1 1 0 1 1 0 
30 -> 1 1 1 1 0 1 1 0 
31 -> 0 1 1 0 1 1 1 0 
32 -> 0 0 0 0 0 0 0 0 
33 -> 0 0 0 0 0 0 0 0 
34 -> 0 0 0 0 0 0 0 0 
35 -> 0 0 1 1 0 1 1 0 
36 -> 1 0 1 1 0 1 1 0 
37 -> 0 1 1 0 1 1 1 0 
38 -> 0 0 0 1 0 1 1 0 
39 -> 0 0 1 0 0 1 1 0 
40 -> 0 0 0 0 0 0 0 0 

我取了字节 nr 6:10011110 -> 0011 是 nr 3,3 对应的 CMR 值是 18。我跳过 18 个字节,然后到达字节 nr。6+18 = 24: 00000000 - 0 的 CMR 值为 13,我跳过另外 13 个字节 -> 24+13=37: 01101110 -> 1101is 13 WHICH ISN'T IN CMR table

我做错了什么?我想以二进制方式打印是正确的。下面是读取每一帧的算法(不用于显示二进制方式):

private void displayNrOfFrames() throws Exception{
        FileInputStream fis = null;

        try {
            fis = new FileInputStream(mFile);
            long result = fis.skip(6);
            if(result != 6){
                throw new Exception("Could not skip first 6 bytes(header) of AMR.");
            }

            int number = 0;
            int bit = 0;
            byte b;
            BitSet bs;
            while((b = Integer.valueOf(fis.read()).byteValue()) != -1){     
                bs = Util.fromByte(b);          
                number = 0;
                //convert bits [1..4] to number
                for (int i = 1; i <= 4; i++) {
                    bit = bs.get(i)? 1:0;
                    number += bit*Math.pow(2, 4 - i);                   
                }
                System.out.println(number);
                if(!CMR_MAP.containsKey(number)){
                    throw new Exception("Could not parse AMR file.");
                }
                //skip the number of bytes of this frame.
                fis.skip(CMR_MAP.get(number));

            }       

        } catch (IOException e) {
            e.printStackTrace();
        }
    }

[EDIT]

看来我做错了从字节到 BitSet 的转换,然后导致算法失败。在字节 nr.6 处,它应该表示为数字 121,但错误地表示为 nr 158。二进制输出也是错误的,因为它使用相同的转换。我没有检查转换方法(我没有在这里发布)。对不起打扰。

4

1 回答 1

1

我希望我的回复不会太晚。

首先要做的事情:从同一个参考资料 中,您可以看到前 6 个字节(文件头)应该是 0x23、0x21、0x41、0x4D、0x52、0x0A。这是一个常数值,应该始终存在。如果它不存在,则该文件可能已损坏并且不应使用。所以你不应该盲目地跳过前 6 个字节。

现在,AMR 编解码器支持 DTX(不连续传输)。DTX 只不过是一种通过在声码器检测到静音时产生更少数据来节省带宽的方法。您的 amr 解析器应该准备好期待 DTX。对于 AMR-NB(amr 窄带或简单的 amr)DTX 使用模式 8 发出信号。因此您的 CMR 映射应包含以下条目

8 AMR SID 6(SID 是静音指示器...表示静音期开始)

在 SID 之后,会有实际的静音帧,长度为 1 个字节(只是标题......没有数据),所以你应该有条目

15 AMR NO_DATA 1

模式 9-11 应该被丢弃。模式 12-14 保留供将来使用(通常这些也被丢弃)。以上所有信息均已提供,请记住正在使用单通道 AMR。

在您粘贴的印刷品中

6 -> 1 0 0 1 1 1 1 0

这应该是 AMR Toc 标头

    0 1 2 3 4 5 6 7
   +-+-+-+-+-+-+-+-+
   |F|  FT   |Q|P|P|
   +-+-+-+-+-+-+-+-+

对于存储,F 位应为 0,但在您的示例中为 1。最后两位(填充位)必须为零,但在您的示例中,这些不是 0。我相信您的示例并没有在这里讲述完整的故事。

于 2013-07-11T06:29:55.807 回答