所以我尝试使用 librispeech 数据集 dev-clean 创建一个语音识别神经网络。我试图将https://github.com/soheil-mpg/Speech-Recognition中的代码转换为 jupyter notebook。
一切似乎都在工作。该模型可以训练并且不会给出任何错误。但是当使用 model.predict() 我得到以下错误:
AssertionError: Could not compute output Tensor("ctc/ExpandDims_22:0", shape=(None, 1), dtype=float32)
我将 Jupyter Notebook 上传到https://github.com/jake-salmone/ASR
代码几乎相同,我唯一改变的是,我不使用 json,而是使用 pandas DataFrame。