我是 NLP 的新人,我正在尝试做文本分类工作。在做这项工作之前,我知道我们应该做词嵌入。我的问题是我应该只对训练数据进行词嵌入工作(以便测试数据仅从训练数据的预训练 vec 模型中获取向量),还是同时对训练数据和测试数据进行?
问问题
701 次
我是 NLP 的新人,我正在尝试做文本分类工作。在做这项工作之前,我知道我们应该做词嵌入。我的问题是我应该只对训练数据进行词嵌入工作(以便测试数据仅从训练数据的预训练 vec 模型中获取向量),还是同时对训练数据和测试数据进行?