12

我正在使用这个程序在 python 中录制声音:

在 Python 中检测和录制音频

我想更改程序以在声卡输入检测到声音时开始录制。可能应该比较块中的输入声级,但是怎么做呢?

4

3 回答 3

13

你可以尝试这样的事情:

基于这个问题/答案

# this is the threshold that determines whether or not sound is detected
THRESHOLD = 0

#open your audio stream    

# wait until the sound data breaks some level threshold
while True:
    data = stream.read(chunk)
    # check level against threshold, you'll have to write getLevel()
    if getLevel(data) > THRESHOLD:
        break

# record for however long you want
# close the stream

您可能希望使用块大小和阈值,直到获得所需的行为。

编辑:

您可以使用内置的audioop包来查找样本的均方根 (rms),这通常是您获得级别的方式。

import audioop
import pyaudio

chunk = 1024

p = pyaudio.PyAudio()

stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=44100,
                input=True,
                frames_per_buffer=chunk)

data = stream.read(chunk)

rms = audioop.rms(data, 2)  #width=2 for format=paInt16
于 2010-04-19T17:03:25.627 回答
5

通常通过使用某些声音块的均方根(RMS) 并将其与您设置的某个阈值进行比较来检测何时没有静音(该值将取决于您的麦克风的灵敏度和其他事情所以你必须调整它)。此外,根据您希望麦克风检测到录制声音的速度,您可能需要降低块大小,或计算重叠数据块的 RMS。

于 2010-04-19T15:30:26.243 回答
1

如何做到这一点在您提供的链接中指示:

print "* recording"
for i in range(0, 44100 / chunk * RECORD_SECONDS):
    data = stream.read(chunk)
    # check for silence here by comparing the level with 0 (or some threshold) for 
    # the contents of data.
    # then write data or not to a file

每次在循环中读取数据时,您必须设置阈值变量并与数据中的平均值(幅度)或其他相关参数进行比较。

您可以有两个嵌套循环,第一个用于触发录音,另一个用于在此之后连续保存声音数据块。

于 2010-04-19T17:15:41.183 回答