有没有办法处理包括循环的注意力解码器块?实施在此Colab Link上
问题
我希望导出一个包含解码循环的注意力块。由于这个问题,LSTMCell 似乎无法导出到 ONNX 。所以我使用 LSTM 工作,如 LSTMCell,采用单时间步进行推理。我该如何处理这种模型?这是pytorch中onnx导出功能的问题吗?
如果我使用 use_external_data_format=True 选项导出,它不会保存到单个文件,而是很多单独的文件。
我在ONNX github 问题中打开了一个问题并在 stackoverflow 中询问,因为我不确定它是错误/功能问题还是问题。
笔记
似乎以下导出非常大的图形的实现无法导出到 ONNX 并显示以下错误。
RuntimeError: Exporting model exceed maximum protobuf size of 2GB. Please call torch.onnx.export with use_external_data_format=True.