我正在尝试进行文本分类,并在句子级别使用预训练的 Glove 词嵌入。我目前正在使用非常幼稚的方法,即平均单词向量来表示句子。
问题是如果句子中没有出现预训练的单词怎么办,如果出现这种情况怎么办?只是忽略这句话还是给这个句子向量随机分配一些值?我找不到处理这个问题的参考资料,大多数论文只是说他们使用平均预训练词嵌入来生成句子嵌入。
我正在尝试进行文本分类,并在句子级别使用预训练的 Glove 词嵌入。我目前正在使用非常幼稚的方法,即平均单词向量来表示句子。
问题是如果句子中没有出现预训练的单词怎么办,如果出现这种情况怎么办?只是忽略这句话还是给这个句子向量随机分配一些值?我找不到处理这个问题的参考资料,大多数论文只是说他们使用平均预训练词嵌入来生成句子嵌入。