我有一个系统生成的数据流(例如 3D 位置),它看起来像:
(pos1, time1) (pos2, time2) (pos3, time3) ...
我想使用机器学习技术从给定的数据流中估计特定事件的可能性(或检测)。我做了什么:
- 如果事件发生在该帧,我在每一帧都用“是”标记我的数据,否则它被设置为“否”。
(pos1, time1, NO) (Pos2, time2, Yes) (pos3, time3, NO) ...(posK, timeK, Yes)...
- 通过给出L个连续帧来设置像L这样的窗口长度来训练模型,并且相应的标签由该窗口上最后一个元素的标签设置:
(pos1, Pos2, pos3, NO) (pos2, Pos3, pos4, NO) (pos3, Pos4, pos5, NO) ... (posK-2, PosK-1, posK, YES) ...
- 最后,我用这一套训练了我的模型。
- 对于测试,我连接L个连续的帧并要求模型为这组数据找到相应的标签(例如是或否)。
我意识到“NO”的出现比“YES”更频繁。仅仅是因为系统主要处于空闲状态而我没有任何事件。所以会影响训练。
你能给我一些提示吗:1)什么类型的机器学习模型最适合这个问题。2)目前我将输出分类为“是”或“否”,但我希望随时了解事件发生的概率。你建议什么样的模型?
谢谢