如果我有一组句子,并且在这些句子中,单词之间存在一些依赖关系。我想训练 BERT 来预测哪些词与其他词有依赖关系。
例如,如果我有这句话:
我们在法国首都巴黎四处走动。
0--------1--------2--------3-----4----5--------6-----7- --8-----9----10---11(单词索引)
我希望 BERT 预测Paris
的位置France
。因此,将任务塑造为序列标记任务。
如果该单词与句子中的任何其他单词或其他单词的索引之间没有关系,则单词的标签可以是-1;对于我们上面的例子,Paris
word 应该有 11 作为 word 的索引France
。
将索引作为标签放置是否正确?