我最近才开始参与这个项目,我对此感到非常兴奋。所以感谢所有的辛勤工作。
我正在使用:运行 High Sierra 2.6 Ghz Intel Core i7 Nvidia GForce Gt 650M 1Gb 16 gb 内存的 2012 Macbook Pro
我的第一个想法是使用自己的样本进行编码+解码。我跟着 Jupyter notebook 的例子写了一个小 Python 脚本来处理一个短的 wav 文件——我们说的是 2 到 3 秒长。编码很容易完成,但我还没有成功解码,因为它花费的时间太长了。我把它放在了一夜之间,差不多 7 个小时后它还在运行。尝试了几个不同的文件,结果相同。
我现在运行的唯一线索是此错误:您的 CPU 支持未编译此 TensorFlow 二进制文件以使用的指令:SSE4.2 AVX
显然,为我的特定架构从源代码编译可能是一种加快速度的方法——但我的感觉是它现在非常慢
难道我的电脑就注定了这种性能?难道我做错了什么?还是我需要为我的机器重新安装 w/优化?
为清楚起见,我的代码如下。谢谢,麻烦您了。
导入操作系统
将 numpy 导入为 np
从 magenta.models.nsynth 导入实用程序
从 magenta.models.nsynth.wavenet 导入 fastgen
fname = 'aggression.wav'
sr = 16000
音频 = utils.load_audio(fname, sample_length=40000, sr=sr)
sample_length = audio.shape[0]
print('{} 个样本,{} 秒'.format(sample_length, sample_length / float(sr)))
编码 = fastgen.encode(音频,os.path.abspath('model.ckpt-200000'),sample_length)
打印(编码。形状)
np.save(fname + '.npy', 编码)
fastgen.synthesize(编码,save_paths=['gen_' + fname],samples_per_save=sample_length)
sr = 16000
合成 = utils.load_audio('gen_' + fname, sample_length=sample_length, sr=sr)
print('洋红色测试')