我正在做一个项目,我有一个用户击键时间数据的子集。这意味着用户进行了 n 次尝试,我将在各种分类算法中使用这些记录的尝试时间数据,以供未来用户尝试验证登录过程由用户或其他人完成。(简单地说,这是生物识别)
我有 3 次不同的用户登录尝试过程,当然这是无限数据的子集。
到目前为止,这是一个简单的分类问题,我决定使用 WEKA,但据我了解,我必须创建一些假数据来提供分类算法。用户的测量尝试将为 1,假数据将为 0。
我可以使用一些优化算法吗?或者有什么方法可以创建这个假数据来获得最少的误报?
谢谢