我正在尝试在数据流中编写半监督异常值检测算法。我有一个训练数据集,它具有系统的正常和异常行为。我的任务是检测系统产生的数据流中的异常值。为了模拟数据流,我将数据分批。
B1(990,-), B2(106,-), B3(101,5), B4(106,-), B5(101,5)
% where Batch_number(#normal, #abnormal)
B1
代表训练数据(仅包括正常数据记录),而 代表B2,B3,B4,B5
测试批次。B3
并有B5
异常数据记录。中的正常数据B3-B5
取自B1
。我的问题是,对于半监督学习,这有意义吗?从 中获取正常数据是否正确B1
?