问题标签 [audiosegment]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
file - 在一个文件夹中转换多种音频文件格式,并制作一个单独的文件夹来存放
我想使用 python 3 将多个音频文件格式从一个文件夹(名为“aud_test”)转换为唯一的 WAV 格式。在此之后,将所有文件保存在另一个文件夹(名为“re_test”)中,如下面的代码中所述。
收到如下所述的错误消息:
python - python QMediaPlayer 发布资源
我有一些代码:
使用 pyqt5 AudioInput 从麦克风录制
使用 pydub AudioSegment 写入文件 record.mp3。
使用以下代码预览 record.mp3:
def preview_record(self,ui): filename = self.record_path #filename = filename.replace(" ","+") url = QtCore.QUrl.fromLocalFile(r""+filename) content = QtMultimedia.QMediaContent(url) self.player = QtMultimedia.QMediaPlayer() self.player.setMedia(content) self.player.play()
问题是,如果我预览录制的文件,然后录制一个新文件,那么在第 2 步):
这是因为资源已打开以供预览。我怎样才能释放资源来解决问题?
编辑:重现问题的示例:
要重现它,请按照以下步骤操作:
- 按录制按钮开始录制
- 按停止按钮停止录制
- 按预览按钮预览录制(并等待预览完成)
- 再次按下记录按钮以获取新记录
- 按停止按钮停止新录制
错误是:
python - 为什么 AudioSegment 不读取“mp3”?
我试图读取我用绝对路径提供的文件。当我首先运行我的代码时,我看到的是这条消息:
我试过这个:
我单独安装ffmpeg
了pip
. 但这没有帮助。当我尝试这个时:
track_path
自动生成正确的绝对路径在哪里。所以我得到了这个错误:
我使用它时的完整代码:
python - 拆分音频段
在这里,我正在练习分析音频(wav 格式),以消除给定范围内的低音量并导出到新音频。它被格式化为 int16 数组,最大值给出 +(某个数字),最小值给出 -(某个数字)。现在结果是输出音频太小了,我认为问题出在错误的范围内。那么如何选择合适的范围呢?我在 min/2 和 max/2 之间给出了它。
python-3.x - 从 numpy.ndarray 加载时,pydub.AudioSegment 会弄乱音频数据
我必须以编程方式混合音频文件(在录音中添加背景噪音),我的所有文件都是 .opus 格式的 8-9 小时长的录音。
我曾尝试使用pydub.AudioSegment
在内存中加载一个,但出现以下错误:
所以显然我不能pydub.AudioSegment
用来加载我的文件,因为它们太大了(我试图打开的文件实际上是磁盘上的 48MB,所以我猜它们太大而无法加载到内存中pydub
?)。无论如何,我已经设法使用librosa
来加载文件。
而且我认为我可以通过从(这是 a )创建一个pydub.audio_segment.AudioSegment
对象来克服这个问题。sound_data_librosa
numpy.ndarray
这似乎工作正常,但是当我将它写回磁盘时,它听起来像是随机噪音。
所以我还没有修改任何东西,但不知何故我丢失了所有的音频数据。我无法理解到底是什么问题。有什么我做错了可以修复的地方,这样我就不会扭曲音频数据?
此外,我不一定非要这样做,只是我一直在用它pydub.AudioSegment
来修改我的音频文件(应用增益、覆盖、作为 .opus 文件在磁盘上写入)所以这就是为什么我需要将它们加载为pydub.audio_segment.AudioSegment
目的。如果有另一种方法可以在 python 中做同样的事情,如果你能指出的话,我将不胜感激。我主要担心的是缺乏对 .opus 文件(读取和写入)的支持,这就是我试图坚持使用 .opus 文件的原因pydub
。
python - 无法弄清楚为什么 PyDub 不起作用
我正在尝试将 pydub 用于音乐项目,但是在尝试使用这段代码播放声音时
我收到以下错误:
有人明白为什么它不起作用吗?我对python相当陌生,所以我不知道。
python - 如何使用 pydub python 导出大型音频文件?
我正在尝试使用pydub导出音频文件。我以某种mp3
格式完成了它,但是它真的很慢。然后我发现使用wav
格式可以使过程更快,但是输出文件的大小会更大。
我使用的是64 位版本的 python,所以 pydub 可以导出 1 小时长的音频文件。但我需要导出10 小时长的音频文件。这里它说“MemoryError”。
如何让 pydub 导出 10 小时长的音频文件?或者也许有一些pydub 的替代品可以让您导出 10 小时长的音频文件?
编辑:
问题不在于出口。问题出在AudioSegment
. 当我尝试打开一个新的大文件(10 小时长的音频)时,出现“MemoryError”。
我怎么解决这个问题?
python - PyQt5图表实时绘图
音频图表.py
audio_chart_code.py
使用命令运行程序:运行前,下载精灵宝可梦主题曲python audio_chart_code.py
并将其放在同一目录下。
正如您所听到的 - 看到情节和声音之间存在不匹配延迟。另请注意,在使用 pyinstaller 命令生成可执行文件后,我尝试从平板电脑运行程序,但没有成功(应用程序几乎崩溃)。
任何建议都会很有用,克里斯·帕帕斯
- 我用 pyqtgraph 做了一个类似的程序,但它有同样的延迟问题......:/
python - 音频切片的服务质量 (QoS)
如果 QoS 是 128kB/sec(CD 质量),我想知道数据包大小是多少,以及数据包时间是多少。
如果我选择 chunk=1024 那么数据包的时间是1000*1024/(128*1024)=7.8125msec
.
问题是在 pydub AudioSegment 我不知道如何使用十进制数字(7,8125)
如果我选择块 = 16384,那么 OK 段时间将为 125 毫秒。
但我认为 16384 很大.. :/
有什么建议吗?
python - pydub.AudioSegment.from_file 找不到文件
您好我正在尝试使用 Google Web Speech API 进行语音识别,我想将音频文件转换为文本。我已经能够在我的树莓派 4 上编译此代码,但是当我在我的 Windows 计算机上编译它时,我得到一个找不到文件的错误。
这是错误:
这是我一直在使用的代码: