1

我想使用预定义的 emobase.config 文件使用 opensmile 提取音频功能。但是,当我输入 .wav 时,我只得到一个帧大小的输出。

我将帧模式更改为固定,并给出了固定步长和固定大小的值,但它会引发错误。我不知道像 emobase.conf 这样的内置配置文件是否会为整个视频而不是帧生成输出。

有没有办法为内置配置文件提取每帧大小的特征?我得到了自生成配置文件的逐帧输出!但是对于内置的,我不知道该怎么做!

4

1 回答 1

1

这是由配置文件中的设置引起的。在文件末尾的“数据输出配置”中,您会找到“reader.dmLevel=fun”。这意味着只有功能(对整个声音文件而不是每帧采取的措施)将被打印出来。如果将其更改为“lld”(低级描述符),它将逐帧打印出来。我认为这适用于所有 emobase 配置文件和 emo_large 文件。

Tl;dr -> 在配置文件的数据输出配置中将 reader.dmLevel=fun 更改为 reader.dmLevel=lld。

于 2019-12-10T20:07:58.743 回答