我有一个应用程序需要区分好的 HTTP GET 请求和坏的。
For example:
http://somesite.com?passes=dodgy+parameter # BAD
http://anothersite.com?passes=a+good+parameter # GOOD
My system can make a binary decision about whether or not a URL is good or bad - but ideally I would like it to predict whether or not a previously unseen URL is good or bad.
http://some-new-site.com?passes=a+really+dodgy+parameter # BAD
I feel the need for a support vector machine (SVM) ... but I need to learn machine learning. Some questions:
1) SVM 是否适合这项任务?2) 我可以用原始 URL 训练它吗?- 没有明确指定“功能” 3)我需要多少个 URL 才能使其擅长预测?4) 我应该使用什么样的 SVM 内核?5) 在我训练它之后,我如何让它保持最新状态?6) 我如何在 SVM 上再次测试看不见的 URL 以确定它的好坏?我