“pyaudioanalysis”的相关标签问题

0 投票

8 回答

26326 浏览

speech-recognition - 语音检测和辨别的开源代码

我有 15 盘录音带，我相信其中的一盘是我祖母和我谈话的旧录音。快速尝试找到合适的地方并没有成功。我不想听 20 个小时的磁带才能找到它。该位置可能不在其中一个磁带的开头。大多数内容似乎分为三类——按总长度、最长的顺序排列：静音、语音广播和音乐。

我打算把所有的磁带都转换成数字格式，然后再找录音。显而易见的方法是在我做其他事情时在后台播放它们。这对我来说太简单了，所以：是否有任何开源库或其他代码可以让我找到，以增加复杂性和实用性：

非静音区域
包含人类语音的区域
包含我自己的演讲（和我祖母的演讲）的区域

我的偏好是 Python、Java 或 C。

失败的答案，关于搜索词的提示将不胜感激，因为我对该领域一无所知。

我知道我可以轻松地在这上面花费 20 多个小时。

2011-04-22T18:07:19.777

0 投票

3 回答

1074 浏览

python - python - 等长样本的音频分类/'vocoder'thingy

任何人都可以为以下内容提供链接、建议或其他形式的帮助？

目标 - 使用 python 对 10 秒的音频样本进行分类，以便之后我可以对着麦克风说话，让 python 从 db 中挑选并播放最接近匹配的片段（一起淡出）。

我的目标不是获得最接近的匹配，我不在乎音频样本的来源是什么。所以结果可能除了在噪音中说话（有趣）之外没有任何用处。

我希望 python 应用程序能够找到 FFT 的特定匹配，例如在 db 中的 10 秒样本内。我猜麦克风的实时采样会有 100 毫秒的缓冲采样。

有任何想法吗？快速傅里叶变换？什么分贝？其他？

python audio classification fft pyaudioanalysis

2011-11-29T14:43:43.167

0 投票

3 回答

2106 浏览

python - Pip 未正确安装软件包

所以我试图让 hmmlearn 在 Jupyter 中工作，我在使用pip. 我已经尝试过这个解决方案，但没有奏效。

在我看来，pip确实安装了 _hmmc 文件，但这样做不正确。相反，它有名字

_hmmc.cp35-win_amd64

并且文件扩展名是.PYD, 而不是.c

当我运行代码来导入它时，我得到了这个错误：

我不知道为什么pip只是没有正确安装它，即使我尝试使用--no-cache-dir

编辑：所以我想出了问题所在。我的活动 python 环境是 python 3.5，因为我手动将安装的文件传输到我的环境，它失败了，因为我有错误的版本。我不得不更改我的活动 python 环境：使用activate <my_enviroment name> 之后我可以pip再次使用它来安装它，这次它可以工作了。

python pip jupyter hmmlearn pyaudioanalysis

2016-10-12T13:46:50.587

0 投票

1 回答

154 浏览

python-2.7 - 使用 pyAudioAnalysis 时出现“行包含 NULL 字节”错误

我正在尝试使用 pyAudioAnalysis 对一些音频数据进行回归，而不是此处的说明。但是，当我运行时aT.featureAndTrainRegression(args)，Error: line contains NULL byte它会扫描我的 csv 文件。

我已经在网上进行了一些挖掘，并且有很多关于如何从 csv 中删除或忽略空字节的建议，但是我对这些方法没有太多的运气；遍历并删除所有空字节给我留下了一个与原始文件没有相似之处的纯 gobbledygook csv，我犹豫是否尝试另一面：修改audioTrainTestpyAudioAnalysis 中的代码。我的意思是，有足够多的人使用它，我无法相信每个人都会遇到错误，所以必须有一种方法来解决它，而无需修补库的胆量。

我正在使用 OS10.9 运行 Mac，并在 PyCharm 上使用 Python 2.7。任何建议将不胜感激。提前致谢！

python-2.7 csv machine-learning pyaudioanalysis

2016-10-18T00:45:17.070

0 投票

2 回答

958 浏览