问题标签 [source-separation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - Matlab去除人声
我编写了使用 fft 从歌曲中删除人声的程序。在 C# 之前,我决定在 Matlab 中测试降低频率的算法,但无法得到示例中的结果。有噪音。我试过选择任何范围(0.7 - 1.5),但都一样......噪音。我没有什么?请帮我写正确)提前谢谢!
algorithm - 鼓声识别算法
我正在考虑尝试制作一个程序,该程序将使用仅包含鼓声的音频文件自动生成鼓标签。
我曾考虑使用 FFT 在 xxxx ms 间隔内获得平均频谱峰值,然后将其与包含该特定架子鼓和音响装置的所有鼓部分(小鼓、墓穴、基鼓等)的表格进行比较。
但我有一种感觉,这不会那么容易。你们对我可以使用哪些方法来解决我的问题有什么建议吗?
//埃里克
matlab - 试图在 Matlab 中重新创建鸡尾酒会算法,结果错误?
使用这个声音文件:http ://www.ism.ac.jp/~shiro/research/sounds/RSM/X_rsm2.wav
我正在尝试从 matlab 中的 coursera重新创建 Andrew Ng 的机器学习演示文稿( https://class.coursera.org/ml-005/lecture )
我所做的是读取 .wav 文件(16khz,7 秒,2 个通道)
现在我转置 x
现在我继续在鸡尾酒会算法上使用 x
MATLAB 返回:
分离的音频在哪里?
编辑:通过进一步的研究,我发现 W 只是分解矩阵。这意味着如果我的目标是让两个输出分离的声源,这个算法是不完整的。我该如何处理这个分解矩阵?
image-processing - 在这种情况下,熵是什么意思?
python - 在 python 中导入 txt 文件时分隔标题
正如标题所述,我在将标题与具有以下结构的 txt 文件分开时遇到了一些麻烦:
现在这种情况下的标题是“AstraZeneca”。我一直在使用的代码是:
问题是,当我尝试打印第一个标题“namnrad”时,一切正常,但是当我尝试打印第二个标题“namnrad_2”时,我得到“0x109c38270 处文件对象的内置方法读取行”。我应该怎么做才能解决这个问题?先感谢您!
python - 将音乐与广告分开
我正在对如何将音乐与广告区分开来进行大量研究,以便仅获得广告中提到的单词。我遇到了几种使用 librosa 和 pyaudio 的方法,其中讨论了设置高通/低通滤波器。我试过了,但音乐仍然在广告中。
我要研究的另一种方法是扬声器分类。但是,我还不知道如何解决这个问题。有一些可用的深度学习架构,但它们可能无法区分音乐和非音乐。
有人对此有更好的主意吗?
干杯,安迪
python - Python 与 Matlab 中的 FastICA 性能
我正在尝试从 Python 中的 Matlab 移植以下 ICA 实现。据我了解,它使用带有双曲余弦作为对比函数的紧缩正交化。
通过 sklearn使用FastICA 可以获得令人满意的结果,但与 Matlab 相比执行时间非常慢。
作为比较,以下示例数据的执行时间如下:
- Python(
deflation
算法):4.97 秒 - Python(
parallel
算法):0.04 秒 - Matlab:0.04 秒
奇怪的deflation
是,Python 中的 FastICA 算法比 Matlab 实现或 Python 中的 FastICA 算法慢 100 倍以上paralell
。
为什么会有这种巨大的差异,尤其是 Matlab 和 Python 版本之间的差异?我不是 ICA 专家,因此可能缺少我的配置。
这是用于生成示例数据和分析执行时间的 Python 代码:
这是用于在 Matlab 中分析的代码(使用coshFpDeIca.m):