1

我最近才开始参与这个项目,我对此感到非常兴奋。所以感谢所有的辛勤工作。

我正在使用:运行 High Sierra 2.6 Ghz Intel Core i7 Nvidia GForce Gt 650M 1Gb 16 gb 内存的 2012 Macbook Pro

我的第一个想法是使用自己的样本进行编码+解码。我跟着 Jupyter notebook 的例子写了一个小 Python 脚本来处理一个短的 wav 文件——我们说的是 2 到 3 秒长。编码很容易完成,但我还没有成功解码,因为它花费的时间太长了。我把它放在了一夜之间,差不多 7 个小时后它还在运行。尝试了几个不同的文件,结果相同。

我现在运行的唯一线索是此错误:您的 CPU 支持未编译此 TensorFlow 二进制文件以使用的指令:SSE4.2 AVX

显然,为我的特定架构从源代码编译可能是一种加快速度的方法——但我的感觉是它现在非常慢

难道我的电脑就注定了这种性能?难道我做错了什么?还是我需要为我的机器重新安装 w/优化?

为清楚起见,我的代码如下。谢谢,麻烦您了。


导入操作系统

将 numpy 导入为 np

从 magenta.models.nsynth 导入实用程序

从 magenta.models.nsynth.wavenet 导入 fastgen

fname = 'aggression.wav'

sr = 16000

音频 = utils.load_audio(fname, sample_length=40000, sr=sr)

sample_length = audio.shape[0]

print('{} 个样本,{} 秒'.format(sample_length, sample_length / float(sr)))

编码 = fastgen.encode(音频,os.path.abspath('model.ckpt-200000'),sample_length)

打印(编码。形状)

np.save(fname + '.npy', 编码)

fastgen.synthesize(编码,save_paths=['gen_' + fname],samples_per_save=sample_length)

sr = 16000

合成 = utils.load_audio('gen_' + fname, sample_length=sample_length, sr=sr)

print('洋红色测试')

4

1 回答 1

0

不幸的是,wavenet 自动编码器的计算量非常大,您需要一个高端 GPU 才能使其快速运行。幸运的是,Google 与 Colab 一起为您提供了免费的。这个笔记本(https://colab.sandbox.google.com/notebooks/magenta/nsynth/nsynth.ipynb)有一个用 NSynth 合成的例子。

于 2018-11-27T18:42:44.893 回答