半监督学习使用一组标记数据(L)训练一个模型来预测一组未标记数据(U),然后将新的标记数据(L')和原始标记数据(L)分组为完整的标记数据数据。
我想问一下如何提取测试数据。
- 我应该从 (L union L') 中提取测试数据
- 我应该从 (L) 中提取测试数据
哪一个是对的?
如果测试数据是从(L union L')中提取出来的,结果没有意义,因为L'中的答案可能是错误的……?
==================================================== ======== 编辑新
我还有一个想法......
3.我应该在开始时将标记数据(L)拆分为训练数据(L_train)和测试数据(L_test)。
然后用L_train训练一个模型,用它来预测一组未标记的数据(U),然后对预测结果(L')和L_train进行分组。
并且,使用 (L_train union L') 训练模型以在 L_test 上进行测试。
1,2,3哪个是对的?感谢您的回复。