python - PyAutoTune 静默输出

Question

我一直在玩 PyAutoTune 模块一段时间，但我似乎无法让它工作。不幸的是，文档不存在，我唯一需要使用的是示例文件夹中的示例。

我想做的是从 TTS 引擎获取一个 .wav 文件并自动调整它，以获得更像机器人的声音。但我似乎无法让它发挥作用。当我尝试运行 FromFileAutoTune 表单命令行时，我只得到一个没有声音的空 wav 文件。

我试过的：

我尝试编写打印语句来监控流程的不同部分。
我注意到我的 wav 文件有 16 位深度，所以我尝试将块读取为 16 位整数，然后将它们转换为 float32。我得到的数据完全相同，所以这并没有真正帮助。
我可以看到块被正确读取并且数据数组具有正确的格式
我可以看到 rawfromC 数据AutoTune.Tuner(...)几乎总是一长串 0，这让我很担心。
我检查了另一个示例 ( RealTimeAutoTune)，它运行得非常好。我可以用我的麦克风说话并（几乎）实时获得自动调谐的版本。所以我知道该模块以某种方式在那里工作。

由于我插入AutoTune.Tuner()函数的数据在两个示例中具有几乎相同的结构，并且其他参数完全相同，我希望输出非空白，但事实并非如此。我错过了一些明显的东西吗？此外，现在AutoTune.Tuner()对我来说只是一个神奇的黑匣子，除了可以从提供的两个示例中推断出的内容外，没有任何迹象表明它需要什么输入以及它产生什么输出。任何可以为我指明正确方向的事情都非常感谢！

到目前为止，这是我的代码：

#Copyright (c) 2012, Eng Eder de Souza
#AutoTune from Wav File Example!

import sys
import numpy
import scikits.audiolab as audiolab 
import AutoTune

FORM_CORR=0
SCALE_ROTATE=0
LFO_QUANT=0
CONCERT_A=440.0
FIXED_PITCH=2.0
FIXED_PULL=0.1
CORR_STR=1.0
CORR_SMOOTH=0.0
PITCH_SHIFT=1.0
LFO_DEPTH=0.1
LFO_RATE=1.0
LFO_SHAPE=0.0
LFO_SYMM=0.0
FORM_WARP=0.0
MIX=1.0
KEY="c"
CHUNK=2048


NewSignal=[]

if len(sys.argv)<3 :
        print('Usage: '+sys.argv[0]+' <Input audio file.wav> <Output audio file.wav>')
        sys.exit(0)

IN=sys.argv[1]
OUT=sys.argv[2]





f = audiolab.Sndfile(IN, 'r')

FS = f.samplerate
nchannels  = f.channels



datas = f.read_frames(CHUNK, dtype=numpy.int16).astype(numpy.float32)*(1.0/32768.0)
print(datas) #this returns the correct data structure ([0.xxxxx 0.xxxxxx ... 0.xxxx])

while datas !='':

    print(".")
    Signal = datas.data[:]
    print(datas.dtype) #this outputs float32, as it should be

    rawfromC=AutoTune.Tuner(Signal,FS,CHUNK,SCALE_ROTATE,SCALE_ROTATE,LFO_QUANT,CONCERT_A,FIXED_PITCH,FIXED_PULL,CORR_STR,CORR_SMOOTH,PITCH_SHIFT,LFO_DEPTH,LFO_RATE,LFO_SHAPE,LFO_SYMM,FORM_WARP,MIX,KEY)
    for s in rawfromC:
        NewSignal.append(s)
    print(rawfromC) #this almost only returns an array of 0s

    try:
        datas = f.read_frames(CHUNK, dtype=numpy.int16).astype(numpy.float32)*(1.0/32768.0)
        print("datas:"+str(datas)) #datas seems to be correctly formatted

    except:
        break

dataArray = numpy.array(NewSignal)
fmt         = audiolab.Format('wav', 'pcm32')


# making the file .wav
afile =  audiolab.Sndfile(OUT, 'w', fmt, nchannels, FS)

#writing in the file
afile.write_frames(dataArray)

print("Done!")

编辑：查看输出，实际上有一些块，其中几乎 25% 的条目不是 0。但是，这与所需的输出相去甚远......

python - PyAutoTune 静默输出

我试过的：

0 回答 0

Related

Reference