1

我是变形金刚概念的新手,我正在阅读一些教程并编写自己的代码来理解使用变形金刚模型的 Squad 2.0 数据集问答。在拥抱脸网站上,我遇到了 2 个不同的链接

我想知道这两个网站的区别。一个链接是否只有一个预训练的模型,而另一个链接有一个预训练和微调的模型?

现在,如果我想使用,假设一个 Albert 问答模型,并在上面使用我的 Squad 2.0 训练数据集进行训练并评估该模型,我应该进一步连接到哪个链接?

4

1 回答 1

3

我会这样表述:第二个链接基本上描述了“社区接受的模型”,即作为实现 Huggingface 类的基础的模型,如 BERT、RoBERTa 等,以及一些接受度很高的相关模型或经过同行评审。

这个列表的 bin 时间要长得多,而第一个链接中的列表最近才直接在 Huggingface 网站上引入,社区基本上可以上传任意检查点,这些检查点被简单地认为与库“兼容”。通常,这些是由从业者或其他志愿者训练的附加模型,并具有针对特定任务的微调。请注意,界面/pretrained_models.html中也包含来自的所有模型。/models

如果您有一个非常狭窄的用例,您不妨检查一下是否已经有一些模型已经针对您的特定任务进行了微调。在最坏的情况下,无论如何,您最终都会得到基本模型。

于 2020-05-14T14:54:06.877 回答