7

我计划使用 LibSVM 来预测 Web 应用程序中的用户真实性。(1) 收集有关特定用户行为的数据(例如登录时间、IP 地址、国家等) (2) 使用收集的数据来训练 SVM (3) 使用实时数据来比较并生成真实性级别的输出

有人能告诉我如何用 LibSVM 做这样的事情吗?Weka 可以帮助解决这些类型的问题吗?

4

1 回答 1

5

您提到的三个步骤是解决方案的概要。更详细地说:

  1. 确保您获得大量标记数据,即带有真实/非真实注释的行为日志。(如果没有标记数据,您将进入相当先进的半监督学习领域,或者必须考虑其他解决方案。)
  2. 根据您认为可以很好地预测真实性的数据设计许多功能。尝试该方法并对其进行改进,直到它在某些统计标准上足够好为止。使用十倍交叉验证来确保您没有过度拟合。
  3. LibSVM 可以输出概率估计及其答案;见其手册第 8 节。
于 2011-03-10T19:19:53.207 回答