我有一个项目,我正在测试一种对噪声非常敏感的设备(电磁、无线电等)。该设备基于给定的输入(音频)每秒生成 5-6 字节的二进制数据(对于未经训练的人来说看起来像是胡言乱语)。
根据噪声,有时设备会丢失字符,有时会插入随机字符,有时会同时插入多个字符。
我编写了一个应用程序,使用户能够即时查看它生成的错误(与主文件相比[例如设备在理想条件下应输出的内容])。我的算法基本上采用实时数据中的每个字节,并将其与已知主文件中相同位置的字节进行比较。如果字节不匹配,我将在当前位置的两个方向都有一个 10 个字符的窗口,我将在其中寻找附近的匹配项。如果匹配(加上一两个验证),我会在 UI 中直观地标记位置并记录错误。
这种方法工作得相当好,实际上,考虑到传入数据的速度,它也可以实时工作。但是,我觉得我所做的并不是最优的,如果数据以更高的速率传输,这种方法就会崩溃。
我可以采取其他方法吗?这种类型的东西有已知的算法吗?
多年前我读到美国宇航局的数据收集设备(例如,与太空和月球/火星上的飞行器通信的设备)尽管受到太空的巨大干扰,但数据丢失了 0.00001%。
有任何想法吗?