0

我想知道是否有办法以给定的频率选择样本的一部分。我认为按频率索引样本的唯一方法是使用 FFT,但这样做似乎会弄乱样本,使其实际上不再可播放。我想知道如何在给定频率选择样本的一部分同时保持声音可理解?

编辑:确切的说明是“合成每个音高为 150 Hz 且持续时间为 5 秒的元音的示例”。

编辑:我完全误解了我最初需要做的事情。新问题来了:Synthesizing vowel from existing audio sample jin matlab

4

2 回答 2

2

确切的措辞表明您被要求合成,即创建一个新信号,而不是过滤或修改现有信号。此外,它询问 150 Hz 的基本频率(它使用单词pitch而不是频率。我假设基本频率足够好和/或它们的意思:)。

所以,让我试着为你改写这个问题:

Do the following for each vowel sound (A, E, I, O, U, etc):
    Create a 5 second sound with a fundamental frequency of 150 Hz.

我可以想到两种方法来解决这个问题: 1. 总结一些不同强度的正弦波(所有这些都将是 150 Hz 的倍数)。知道强度是这里的诀窍。或 2. 从 150 Hz 的脉冲开始并对其进行过滤。知道要使用的确切滤波器是这里的诀窍,尽管使用正确的脉冲也可能会产生一些影响。无论哪种方式,您都不需要或不希望在生成阶段进行 FFT。如果您不能或不想查找上面的未知数,您可以使用 FFT 分析说出这些声音的真人,并使用分析结果来填补空白。这样做不会太难,但它可能包含在有关语音和/或声学的高级教科书中。

如果您需要更详细的答案,也许您应该创建一个新问题并将其链接到此处以帮助回答该问题。我建议使用以下标签(如果存在):

  • 语音合成
  • 过滤
  • 声音的
  • 语音学
于 2013-11-11T03:17:05.693 回答
1

您应该更精确地定义“在给定频率下”,但您似乎想要的是一个在所需频率上调谐的窄通带滤波器。

然而,窄频率要求与可理解性相反。在极限情况下,单个频率只会给你一个正弦曲线,而清晰度将完全丧失。

于 2013-11-11T00:30:02.400 回答