feature-extraction - 如何在 Opensmile 中使用 emobase.config 文件？

Question

我想使用预定义的 emobase.config 文件使用 opensmile 提取音频功能。但是，当我输入 .wav 时，我只得到一个帧大小的输出。

我将帧模式更改为固定，并给出了固定步长和固定大小的值，但它会引发错误。我不知道像 emobase.conf 这样的内置配置文件是否会为整个视频而不是帧生成输出。

有没有办法为内置配置文件提取每帧大小的特征？我得到了自生成配置文件的逐帧输出！但是对于内置的，我不知道该怎么做！

score 1 · Accepted Answer

这是由配置文件中的设置引起的。在文件末尾的“数据输出配置”中，您会找到“reader.dmLevel=fun”。这意味着只有功能（对整个声音文件而不是每帧采取的措施）将被打印出来。如果将其更改为“lld”（低级描述符），它将逐帧打印出来。我认为这适用于所有 emobase 配置文件和 emo_large 文件。

Tl;dr -> 在配置文件的数据输出配置中将 reader.dmLevel=fun 更改为 reader.dmLevel=lld。

feature-extraction - 如何在 Opensmile 中使用 emobase.config 文件？

1 回答 1

Related

Reference