我有兴趣使用音频文件作为及时发生的事件的记录。也就是说,我将有多个需要及时对齐的数据流,我想使用音频文件作为参考。所以,我想知道是否有可能获得音频流的实际时基,作为相对于实时时钟的引用?
我很欣赏人们可以根据样本计数和采样频率(例如 16KHz)来确定音频剪辑的持续时间。对于短片,这可能是一个很好的估计,但对于长时间(多小时的录制),这个估计有多准确?我想在多个小时内保持亚秒级的精度。
换句话说,音频文件是否存储音频录制的实际开始和停止时间,参考 RTC(实时时钟)。这将允许为音频文件中的每个样本生成一个时基。如果是这样,我可以从 python 音频库中获取这些数据吗?
我正在使用 MP4/AAC 在 Android 平台上进行编码和pydub
后处理。
谢谢。