问题标签 [audio-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python使音频文件的特定部分静音
我有一个音频文件audio.wav
,并且我有一组看起来像这样的时间框架:
X = [(12.31, 14.), (15.4, 18.9), ...]
这些是我希望在我拥有的 .wav 音频文件中完全保持沉默的时间范围。我怎样才能做到这一点?
signal-processing - 声波峰值检测(蟋蟀啁啾)
我正在寻找一种编码方法或找到一个程序,该程序可以实时记录蟋蟀的啁啾声,也可以通过预先录制的音频文件(约 24 小时大)进行实验室实验。
我不太确定如何解决这个问题,因为我是一名 Web 开发人员,但我有 JS 和 python 以及库的经验。我最初的想法是使用 Matplotlib 生成音频可视化器,然后每次达到与板球啁啾的 db 匹配的特定范围的 db 时计数,但我不知道如何处理它。
我已经成功地在在线频谱分析仪(音频啁啾的频谱可视化器)上可视化了啁啾,并且可以清楚地看到它,但是我不知道如何使用代码来计算每个“啁啾”并将其与日期一起记录下来某种值/数据集表中每个啁啾的时间。
任何指导或帮助将不胜感激!
python - 使用 google colab (Python) 从 google 存储加载音频
我将音频文件以 wav 格式保存在谷歌存储中,但是当我尝试使用谷歌 colab 加载音频时,我无法做到。
在我用来从谷歌存储加载音频的示例下方。
但错误:找不到文件名。[Errno 2] 没有这样的文件或目录
我的问题:如何从谷歌存储中加载音频/如何从谷歌存储中读取音频
python - 使用 wavfile.read() 时音频文件的输出不是从零开始的
我使用的所有音频文件在使用 wavfile.read() 时都会产生对我没有意义的输出,我不知道为什么。例如一个文件的输出是
为什么它不像普通音频那样从零开始:-
我想问为什么我在第一个链接中的输出没有正常读取以及如何正常显示它以便我可以正确分析音频。我已经搜索了几天并且可以解决它,所以如果有人可以指导我或为我提供有用的链接,我将不胜感激
signal-processing - 构建可以通过麦克风识别吉他音符和和弦的移动应用程序
集思广益,帮助教孩子吉他的手机游戏。
我正在寻找一个移动游戏平台,它可以让我开发一个游戏的基础,该游戏可以通过麦克风实时识别吉他音符和和弦(或者让我尽可能接近可用的库)。希望有一个内置媒体(麦克风)访问、信号处理、FFT 等的现有平台。
一厢情愿地认为这可以通过 CoronaSDK 解决(因为我对该平台有经验)。
谢谢!
nlp - MFCC 是否取决于音频长度?
例如,我已经用 5-10 秒范围内的 MFCC 音频分数训练了我的模型,然后我预测了 25 秒的音频。这个预测会因为音频的长度而受到影响吗?或者预测将完全取决于我的模型性能?
python - sounddevice 和树莓派 4 导致零星的输入溢出
我想就如何进一步调查问题的原因征求意见。
我正在开发一个音频分析器 python 应用程序。预期的硬件由具有 64 位操作系统的树莓派 4、8 GB 内存、32 GB sd 卡和外部声卡 (hifi-berry adc+dac) 组成。有趣的代码位于 Capture.py 模块中,它将执行以下任务
- 加载实验设置
- 在 NumPy 数组中配置 output_buffer(纯正弦波加包络)和 input_buffer(零数组)
- 设置 sounddevice 并启动流以输出 output_buffer 块并记录输入
- 一些用于测试的 FFT 计算(将移至另一个模块)
我面临一些偶尔的回调状态:(输入溢出,输出下溢),主要是在捕获时间很短(小于两秒)时。大多数情况下,代码按预期工作,但有时这种行为开始发生,就好像回调正在使用大量 CPU 资源一样。有趣的是,如果我增加实验持续时间,超过两到三秒(这意味着更大的缓冲区和更多的内存使用),问题似乎就消失了。这似乎很奇怪(从我的角度来看)。由于它们是预先分配和预先计算的,缓冲区大小对回调函数应该是透明的,对吧?到目前为止,我已经尝试过:
- 将应用程序的友好度降低到 -10;
- 降低采样率(从 192000 Hz 到 48000 Hz 和 44100 Hz);
- 重新启动系统
这些行动似乎都没有对问题产生任何影响。
我的 Capture.py 模块代码供参考。捕获实验是通过start方法启动的,但是问题发生在回调方法上。
python - How to silence specific words in an audio file using python?
I want to mute specific words in audio files. I have a list of words that should be muted. I have tried converting the audio file to text using this code but how can I get the time frame of each word so I can mute them?
python - 使用 Python 检测 RTMP 直播流中的音频剪辑
我有一个实时 RTMP 音频/视频流,我想分析它以在音频流中进行剪辑。音频使用 OGG、MP3 或 AAC 进行编码。关于如何做到这一点,或者我可以使用什么 Python 库的任何想法?提前谢谢了。
-编辑-通过剪辑我的意思是:https://en.wikipedia.org/wiki/Clipping_(signal_processing)
c - 使用 android studio 提高音频增益
我只是 android studio 的新人。这是我提高音频(mp3,wav)文件增益的代码。我不知道如何在 android studio 中实现。我已经在 raw 目录中存储了一个 mp3 文件,我正在使用文本框或搜索栏从用户那里获取增益值,之后它将播放改进的增益音频。有人知道该怎么做吗?