java - 使用 LIBSVM 预测用户的真实性

翻译自：https://stackoverflow.com/questions/5263846 2011-03-10T18:08:18.247

1074 次

7

我计划使用 LibSVM 来预测 Web 应用程序中的用户真实性。(1) 收集有关特定用户行为的数据（例如登录时间、IP 地址、国家等） (2) 使用收集的数据来训练 SVM (3) 使用实时数据来比较并生成真实性级别的输出

有人能告诉我如何用 LibSVM 做这样的事情吗？Weka 可以帮助解决这些类型的问题吗？

1 回答 1

5

您提到的三个步骤是解决方案的概要。更详细地说：

确保您获得大量标记数据，即带有真实/非真实注释的行为日志。（如果没有标记数据，您将进入相当先进的半监督学习领域，或者必须考虑其他解决方案。）
根据您认为可以很好地预测真实性的数据设计许多功能。尝试该方法并对其进行改进，直到它在某些统计标准上足够好为止。使用十倍交叉验证来确保您没有过度拟合。
LibSVM 可以输出概率估计及其答案；见其手册第 8 节。

于 2011-03-10T19:19:53.207 回答