我对 AllenNLP 很陌生,我目前正在使用它的预训练问答模型。我想知道它是否有通道长度限制以确保其性能?我知道 BERT 的最大长度为 512,并且会截断更长的段落。
我在 AllenNLP 上尝试过更长的段落,它似乎有效,但我只是想确认一下。谢谢你。
我对 AllenNLP 很陌生,我目前正在使用它的预训练问答模型。我想知道它是否有通道长度限制以确保其性能?我知道 BERT 的最大长度为 512,并且会截断更长的段落。
我在 AllenNLP 上尝试过更长的段落,它似乎有效,但我只是想确认一下。谢谢你。
是的,这个模型确实限制了段落(上下文)的长度,也可能限制了问题。您可以在 API 文档中阅读更多关于它是如何做到这一点的:https ://docs.allennlp.org/models/master/models/rc/dataset_readers/transformer_squad/ 。
stride
但总而言之,当段落+问题包含多个标记时,将通过在标记窗口上滑动来将段落解析为多个输入实例length_limit
。