Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我遇到了将来自录音不同部分的 pcm 音频样本拼接在一起的问题。这个想法是,它是来自用户通过各种进度条上的记录寻找的音频反馈。它们可以是任意长度(例如 0.1 到 0.5 秒)。我的主要问题是,当我回放这些样本时,它们会导致大量的噪声伪影、失真等。
我想这是样本之间幅度跳跃的结果。我还没有想出解决这个问题的好方法。我做的最后一件事是尝试在它们穿过原点的点截断样本(从正到负,反之亦然),但这并没有太大帮助。有人有想法么?
谢谢
“过零”技巧通常效果很好,短的线性或余弦衰减(~1/30 秒)也是如此。如果您使用淡入淡出,淡入淡出必须足够长以避免爆音,但仍比您正在处理的音频片段短得多。如果您使用过零,则必须确保您正在处理的音频实际上过零(这对于低频和已经偏移的信号可能是一个问题。为了避免偏移,这两个问题,您可以高首先通过过滤信号)。
如果您的片段经常处于 0.1 到 0.5 毫秒范围的短端,则可能会出现各种心理声学现象。您应该首先将自己限制在更长的部分,看看它是否有效,然后看看你能做多短。这样你就知道问题出在你的代码上还是只是让它变短了。