spectrogram - 为什么在分析声学参数（如强度、RMS 幅度、基频等）时，单声道声音优于立体声

Question

在语音分析中，在使用像 Praat 这样的软件时，我看到人们喜欢单声道而不是立体声。即使录音是使用立体声麦克风完成的，音频文件通常也会转换为立体声。除了节省大量内存之外还有什么原因？谢谢。

score 0 · Accepted Answer

我收集了一堆关于是使用单声道还是立体声音频的评论。正如您所说，共识似乎是单声道音频可以节省空间。但是，一些消息来源指出有时您想要使用立体声音频。

您想同时记录电声图数据。将音频和电声门数据作为“立体声”音频保存在一个文件中，可以让您的数据保持整洁。
您想录制一次音频，但还想在录制完成后选择更好的一半音频。

另外，请注意，人类语言几乎是作为单声道信号产生的。我不知道任何依赖立体声音频来传达有意义信息的人类语言。这个链接提到一些涉及紧急通信的职业利用每只耳朵的不同音频同时获取更多信息，但这是我能找到的关于立体声语言使用的资源。

当多个文件不是全单声道或全立体声时，Praat 似乎也无法处理它们，因此这也可能是使用单声道音频的一个原因。将单声道音频复制到双耳与将立体声音频还原为单声道音频并不完全相同。

这是我发现的最有用的资源：

来自https://colangpraat.wordpress.com/part-3-how-to-record-using-praat/

在 Objects 窗口的菜单栏中，单击 NEW 和 RECORD MONO SOUND。PRAAT 还具有以立体声录制的能力，但在收集语言数据时，首选单声道文件。

来自https://web.stanford.edu/dept/linguistics/corpora/material/PRAAT_workshop_manual_v421.pdf

在大多数情况下，您将录制单个语音或语音样本，为此您可以选择“录制单声道声音...”。如果要进行立体声录音，显然必须使用“录制立体声”。例如，后一种选项可用于将 Glottal Enterprises ( http://www.glottal.com/electroglottograph.html ) 的 EG-2 PC 电声图仪的立体声输出信号数字化，从而使您可以同时录制语音和 EGG 信号。

来自https://www.fon.hum.uva.nl/praat/manual/ExperimentMFC_2_2__The_stimuli.html

您还可以使用 AIFF 文件，在这种情况下，stimulusFileNameTail 可能是“.aiff”，或者 Praat 支持的任何其他类型的声音文件。但所有声音文件必须具有相同数量的声道（即全部为单声道或全部为立体声）和相同的采样频率。

来自https://www.fon.hum.uva.nl/david/LOT/sspbook.pdf

在继续之前，我们重复一下，声音在 Praat 中表示为矩阵，这意味着声音存储为数字行。单声道声音是一个只有一行和多列的矩阵。立体声是具有两个通道的声音，每个通道在矩阵的一行中表示。因此，立体声是一个具有两行的矩阵，并且两行具有相同的列数。每个矩阵单元包含一个样本值。每当我们想对声音使用公式时，我们可以将声音视为矩阵。

来自https://person2.sol.lu.se/SidneyWood/praate/monstee.html

但是请确保您可以从将通道合并为一个单声道信号中获得一些好处。在 Praat 中使用 Stereo 录音机并获取最佳频道更简单。

spectrogram - 为什么在分析声学参数（如强度、RMS 幅度、基频等）时，单声道声音优于立体声

1 回答 1

Related

Reference