我正在尝试使用预先训练的模型使用新的标记文档(TaggedDocument)进行训练。
预训练模型是具有唯一id为label1_index的文档的训练模型,例如Good_0,Good_1到Good_999,训练数据的总大小约为7000
现在,我想用带有label2_index的唯一id的新文档训练预训练模型,例如,Bad_0,Bad_1 ...到Bad_1211,训练数据的总大小约为1211
火车本身是成功的,没有任何错误,但问题是,每当我尝试使用“most_similar”时,它只会建议标有 Good_ 的类似文档......我希望标有 Bad_。
如果我从一开始就完全训练,它会给我预期的答案——它推断出一个新给定的文档,类似于标有“好”或“坏”的文档。
但是,上面的练习不会像从一开始就完全训练的那样起作用。
是继续火车无法正常工作还是我犯了一些错误?