8

【这不是重复的。类似的问题是关于人们可以控制源数据的场景。我没有。】</p>

在日本有一种叫做“紧急警报广播系统”的东西。激活时看起来像这样:http ://www.youtube.com/watch?v=9hjlYvp9Pxs

在上面的视频中,大约在 2:37,发送了一个 FSK 调制信号。我想解析这个信号;即给定一个包含信号的 WAV 文件,我想最终得到一个包含 0 和 1 的 StringBuilder 以便稍后处理它们。我有二进制数据和所有的规范,但问题是我对音频编程一无所知。:(

这只是一个爱好项目,但我上瘾了。电视和收音机制造商可以接收到这个信号并让他们的设备对其做出反应,所以这不会那么难,对吧?:(

关于信号的事实:

  • 标记音为1024Hz,停止音为640Hz
  • 每个音是 15.625ms 长
  • 信号开始前和结束后的 2 秒暂停(可能用于检测目的)

到目前为止我做了什么:

  1. 编写一个简单的 RIFF 解析器,它接受 8 位单声道 WAV 文件并允许我从中获取样本。我已经对其进行了测试,并且可以正常工作。
  2. 一个需要 15.625ms 样本的循环,并且:
    1. 使用 RMS 寻找两秒钟的静默
    2. 使用 Goertzel 算法来确定信号是 1024Hz 还是 640Hz

我遇到的问题:

  • 根据测试数据,在循环期间吞下 0 和 1。
    • 鉴于信号的清晰度(YouTube 到 MP3 翻录),这不应该发生。
    • 如果我在 Audacity 中生成一个重复的 01 序列 30 次,我的程序将拾取 01 对中的大约 10 个,而不是 30 个
  • 有时交换 0 和 1(上述副作用?)
  • 如果我调整代码使其适用于一个测试声音文件,其他测试声音文件将停止工作

我的问题:

  • 谁能给我一个关于如何在软件中正确完成 FSK 解码的高级概述?
  • 我是否需要应用某种滤波器将信号限制在 640Hz+1024Hz 并静音其他所有信号?
  • 保持时间正确的最佳方法是什么?也许我做错了?
  • 关于这种音频处理的初学者文献的任何链接?我真的很想学习并让它发挥作用。

读取样本的代码是(简化的):

StringBuilder ews_bits = new StringBuilder();
double[] samples = new double[(int)(samplesPerMs * 16.625D)];
int index = 0, readTo = /* current offset + RIFF subChunk2Size */;
BinaryReader br = /* at start of PCM data */;

while (br.BaseStream.Position < readTo)
{
    switch (bitsPerSample / 8)
    {
        case 1: // 8bit
            samples[index++] = ((double)br.ReadByte() - 127.5D) / 256D;
            break;
        case 2: // 16bit
            samples[index++] = (double)br.ReadInt16() / 32768D;
            break;
    }

    if (index != samples.Length)
        continue;

    /****** The sample buffer is full and we must process it. ******/

    if (AudioProcessor.IsSilence(ref samples))
    {
        silence_count++;
        if (state == ParserState.Decoding && silence_count > 150)
        {
            // End of EWS broadcast reached.
            EwsSignalParser.Parse(ews_bits.ToString());

            /* ... reset state; go back looking for silence... */
        }
        goto Done;
    }

    /****** The signal was not silence. ******/

    if (silence_count > 120 && state == ParserState.SearchingSilence)
        state = ParserState.Decoding;

    if (state == ParserState.Decoding)
    {
        AudioProcessor.Decode(ref samples, sampleRate, ref ews_bits);

        bool continue_decoding = /* check first 20 bits for signature */;
        if (continue_decoding) goto Done;

        // If we get here, we were decoding a junk signal.
        state = ParserState.SearchingSilence;
    }

    /* Not enough silence yet */
    silence_count = 0;
Done:
    index = 0;
}

音频处理器只是一个类:

public static void Decode(ref double[] samples, int sampleRate, ref StringBuilder bitHolder)
{
    double freq_640 = GoertzelMagnitude(ref samples, 640, sampleRate);
    double freq_1024 = GoertzelMagnitude(ref samples, 1024, sampleRate);

    if (freq_640 > freq_1024)
        bitHolder.Append("0");
    else
        bitHolder.Append("1");
}

public static bool IsSilence(ref double[] samples)
{
    // power_RMS = sqrt(sum(x^2) / N)

    double sum = 0;

    for (int i = 0; i < samples.Length; i++)
        sum += samples[i] * samples[i];

    double power_RMS = Math.Sqrt(sum / samples.Length);

    return power_RMS < 0.01;
}


/// <remarks>http://www.embedded.com/design/embedded/4024443/The-Goertzel-Algorithm</remarks>
private static double GoertzelMagnitude(ref double[] samples, double targetFrequency, int sampleRate)
{
    double n = samples.Length;
    int k = (int)(0.5D + ((double)n * targetFrequency) / (double)sampleRate);
    double w = (2.0D * Math.PI / n) * k;
    double cosine = Math.Cos(w);
    double sine = Math.Sin(w);
    double coeff = 2.0D * cosine;

    double q0 = 0, q1 = 0, q2 = 0;

    for (int i = 0; i < samples.Length; i++)
    {
        double sample = samples[i];

        q0 = coeff * q1 - q2 + sample;
        q2 = q1;
        q1 = q0;
    }

    double magnitude = Math.Sqrt(q1 * q1 + q2 * q2 - q1 * q2 * coeff);

    return magnitude;
}

谢谢阅读。我希望你能帮助我。

4

2 回答 2

2

我就是这样做的(高级描述)

  1. 通过FFT运行您的信号
  2. 寻找大约 640Hz+1024Hz 的稳定峰值(我会说至少 +/- 10Hz)
  3. 如果信号稳定约 10 毫秒(稳定时,我的意思是大约 95% 的样本在同一范围 640Hz+/-10Hz(或 1024Hz+/-10Hz)内)将其作为音调检测。也使用此检测来检测同步你的计时器,告诉你什么时候期待下一个音调。
于 2013-12-06T08:11:33.797 回答
1

在重写了示例解析循环和静默检测部分后,我现在已经完成了大约 90% 的工作。我的实现中有两个主要问题。首先是静音检测器过于急切,因此我将其从处理每毫秒的样本更改为每半毫秒的样本。这让我完全了解了 FSK 数据。

下一个问题是我当时认为我可以天真地让解调器查看 15.625 毫秒的样本,因为它通过 WAV 文件自行工作。事实证明,虽然这对前 90 位左右效果很好,但最终音调会变得比预期的更长或更短,并且解调器会不同步。当前代码找到并纠正了这种时序不匹配的 13 位。特别容易受到这种影响的是信号从标记变为空间的位置,反之亦然。

猜猜“模拟”一词包含“肛门”是有原因的。这是。我真的希望我能更多地了解信号理论和数字信号处理。:(

我是如何发现这一切的:我导入了 MP3 并使用 Audacity 将其修剪为 FSK 部分。然后我让 Audacity 为每一位生成标签。之后,我根据标签突出显示了位。

于 2013-12-07T14:48:22.543 回答