问题标签 [libsox]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - 如何在 Windows 中将 flac 支持(flac 库)安装到 sox
当我尝试处理我得到的 flac 文件时
“没有文件扩展名 flac 的处理程序”
错误。有什么办法可以在windows中解决这个问题。
speech-recognition - 为什么在 Windows 中 sox 修剪和拆分操作(基于静默)太慢
我正在尝试将 sox 实现到语音识别程序中。但是,sox 用 5-7 个单词(文件大小也在 200-400kb 之间)非常简单的句子修剪单词需要将近 10 秒,这是不可接受的。我能做什么,或者哪些其他选项可以用于相同的目标。顺便说一下,我使用的 sox 参数是
sox -c 1 -r 16000 input.wav output.wav 静音 1 0.5 1% 1 0.1 1%:新文件:重启
sox - SOX 和淡入淡出
我正在尝试为几个我不知道总持续时间(以秒为单位)的波形文件创建淡入和淡出。我阅读了手册,但我看到的所有示例看起来我需要知道文件的完整长度。有人可以在不知道 wav 文件的完整长度的情况下发布一个在 5 秒内淡出并在 7 秒内淡出的示例吗?
sox - sox 重采样库 API 的问题
团体,
目标:我正在尝试使用 sox-resample 库,从输入速率(44.1Khz,2 通道,16 位)下采样到输出速率(16Khz,1 通道,16 位)。是否可以在此过程中使用 sox-resample 库。
Sox Resample 库来源在这里:http: //sourceforge.net/p/soxr/code/ci/master/tree/
我试过soxr_oneshot这个api,产生的输出,没有输入缓冲区的原声,它有一个奇怪的声音输出,与原声输入相差甚远。
还尝试了 soxr_create 和 soxr_process api,但没有得到正确的输出。
我不确定,如果这些 api(soxr_oneshot、soxr_create 和 soxr_process)有一个选项,可以降级通道数,以及我们是否可以指定 16 位或 8 位。
也不确定我是否应该使用 LibSox api,例如 sox_create_effect/sox_add_effect,以及这是否是一个更好的选择。
这是使用 soxr_oneshot 的示例代码,请告诉我,可能有什么问题,或者如果您有任何建议。
请让我知道,可能是什么问题,或者如果您有任何建议。
c - 使用 libsox 对 wav 文件进行下采样
我正在尝试使用 Sox 库 C 程序( http://sox.sourceforge.net/ )将 16KHZ 16 位签名 PCM 编码波形文件转换为 8KHz 8 位 mu 编码 wav 文件。从 PCM 到 mu 的转换工作正常。但是当我应用下采样效果时,输出文件的持续时间只是 i/p 文件的一半(见下文)。我使用了如何在 sox C 库进行格式转换时更改采样率一文中提到的技术?但这对我没有帮助。
当我执行以下代码时,我看到一个警告
输出:
代码:
编译和执行:
audio - 如何使用 libsox/go-sox 将立体声 wav 转换为两个单声道 wav 文件
我有 go-sox 成功地将立体声 wav 文件分成两个文件。但是有两个问题:
- 即使文件具有相同的采样率,生成的文件也会大大加快
- 生成的两个文件仍然是立体声而不是单声道
我正在使用的代码在这里:
https://gist.github.com/jsgoecke/ca8fe5b4e0901ed04ee0
关于如何使用以原始速度和单声道播放的文件进行此操作的任何想法?似乎'remix 1'和'remix 2'应该做到这一点。
我使用 brew 在 OSX (v14.4.1_1) 上安装 SoX。
audio - sox - 如何创建比特率为 16kbps 的 mp3 文件
目前使用的命令是
但这是创建一个比特率为 24.0 kbps 的文件。
如何使输出文件的比特率达到 16.0 kbps?
linux - 结合淡入淡出功能并转换为flac文件
我正在使用 linux 尝试淡入淡出并将音频文件转换为 flac,请参见下面的命令
如何将flac 选项“-b 16”添加到上面的行
谢谢
c++ - 使用 soxr 重新采样时访问冲突
我无法让以下代码正常工作:
我有 PCM 短数据进入(input
对象),我希望它也被重新采样为speed
与原始采样率相乘的值,如您所见(44100 是标准)。也是numframes
我发送的数据块的帧数(立体声)
问题是我的应用程序在执行该soxr_process()
方法时崩溃。该方法似乎没有错误,soxr_create()
所以我真的不知道它可能是什么。
我目前只是试图加快声音的速度,因此我将输出缓冲区设置为与原始缓冲区一样大,这足以在重新采样后保存所有内容。
我怎么解决这个问题?我是否给该soxr_process()
方法提供了错误的值?
编辑:
我也尝试过这种方法:
但这也会引发访问冲突错误。
提前致谢!
python - 使用python计算fft
通过wave
在 Python 中使用,我们可以读取 .wav 音频格式并计算信号的频率和功率。但我想直接计算 .mp3 音频格式的频率。我听说过一些关于 Pysox 的事情。Pysox 是否能够读取帧,我们可以使用 Pysox 计算 fft 和频率吗?或者有没有其他软件可以使用 Python 计算 MP3 文件的频率?