假设您有一间会议室,会议在任意临时时间举行。您想保留所有会议的录音。为了使其尽可能易于使用,会议参加者不需要采取任何行动,他们只知道当他们在特定房间开会时,他们会有记录。
显然,仅仅不间断地记录是低效的,因为它会浪费数据存储并且很难筛选。
我认为有两种基本方法可以解决这个问题。
- 录音只是根据声级阈值开始和停止。
- 记录是连续的,但分成 X 分钟的块。发现不包含内容的块将被丢弃。
我更喜欢第二种方式,因为我觉得由于启动晚或触发器失败而丢失数据的风险较小。
我想在 Python 中实现,如果可能的话在 Windows 上实现。
实施建议?
可能值得他们自己提问的额外注意事项:
- 为此目的的最佳音频格式和压缩
- 任何确定有多少发言者在场的方法,假设识别是不切实际的