1

我知道 simpleTransformers 提供了一个更简单的 API,因此我们不必在训练之前对数据进行标记,它是根据我们选择的模型自动完成的,

但我想知道,它是如何完成的,我该如何操作它?

在二进制分类的情况下,如果我有 1 个句子,那么它就是:

[CLS] 这是我的原话。

如果我想再添加 2 个句子,我们有 2 个选项:

选项 1:[CLS] 这是我的原句。[SEP] 这是我的第一句话。[SEP] 这是我的第二句话

选项 2:[CLS] 这是我的原句。这是我的第 1 个额外句子。这是我的第二句话

通常变压器模型会从选项 1 中学习得更好,但由于 simpleTransformer 会自动完成,我想知道如何确保我正在执行选项 1?

4

0 回答 0