1

我目前正在编写一个专门的视频编辑器。它是专业的,因为我学校的讲师使用它来录制电子学习讲座。它使用C#WPFMicrosoft Expression Encoder。剪切和插入视频等基本功能已经完成。现在我正试图找出一种声音识别的方法。这个怎么运作:

  1. 用户选择视频的一部分
  2. 视频编辑器会记下该部分的声音
  3. 视频编辑器在视频的其余部分搜索类似的声音
  4. 视频编辑器会突出显示视频的这些部分,并为用户提供编辑它们的机会。

视频采用 xesc 格式。任何人都可以指导我到任何可以帮助实现这一目标的图书馆/教程吗?对不起,我是声音分析和编辑的新手。

目前找到的库:Naudio & Mediainfo.dll 但是,这些库不支持 xesc。我是否应该事先将这些视频转换为 mp4 以便于进行声音分析?是否有任何算法来检测相似的声音样本?

抱歉,添麻烦了!谢谢!

4

0 回答 0