2

我是一名本科生,在我的毕业论文中,我使用 SVM 来预测公共汽车到达其路线中的公共汽车站的时间。在进行了大量研究并阅读了一些论文之后,我仍然对如何为我的系统建模有一个关键疑问。

我们已经决定使用哪些特征,并且正在收集执行回归所需的数据,但令我们困惑的是使用某些特征作为 SVM 的输入或基于某些特征构建分离机器的含义或后果这些特征中。

例如,在本文中,作者构建了 4 个 SVM 用于预测公交车到站时间:一个用于晴天高峰时段、雨天高峰时段、晴天非高峰时段以及最后一个用于非高峰时段和雨天的 SVM。 .

但是在随后关于同一主题的论文中,他们决定使用单个 SVM,将天气状况和高峰/非高峰时间作为输入,而不是像以前那样将其分解为 4 个 SVM。

我觉得这是一种更多关于经验的事情,所以如果有人知道何时选择其中一种方法,我想听听你们的意见。

提前致谢。

4

3 回答 3

0

Most important question: what is the data like? Second question: what model do you expect to capture this?

So if you want to use SVMs for some reason, keep in mind their basic mechanism is linear, and can only capture non-linear phenomena if data is transformed by a suitable kernel.

For a particular problem at hand that means:

  1. Do you have reason (plots, insights in the problem nature) to believe your problem is linear(ly separable)? Just use one linear svm.
  2. Do you have reason your problem consist of several linear subproblems? Use a linear svm on each of the subproblems.
  3. Does your data seem non-linearly grouped? Try an svm with something like rbf kernel.

Of course, you can just plug in and try, but checking the above may increase understanding of the problem.

于 2012-04-23T14:02:42.523 回答
0

没有其他办法:您必须自己找出答案。这就是你必须写这篇论文的原因。没有人从完美的解决方案开始。每个人都会犯错误。你的问题并不容易,当你从未做过类似的事情时,你不能说什么会起作用。尝试你在文献中找到的一切,比较结果,发展你自己的想法,......

于 2012-04-17T08:46:41.380 回答
0

在您的特定问题中,我会选择单个 SVM。

以我不那么丰富的经验,我会考虑在几个 SVM 中解决问题,原因如下:1)类太不同,或者你的问题中有类和子类。例如在我的例子中:显微镜图像中有几种类型的抗体,它们都可能是阳性或阴性。因此,我没有定义 A_Pos、A_Neg、B_Pos、B_Neg……,而是首先确定图像是正面还是负面,然后确定第二个 SVM 中的类型。

2)特征提取成本太高。前提是您有可能具有发烧特征的类组。您可以先只提取一个小子集,而不是提取单个机器的所有特征,然后如果需要(结果概率不够高)提取更多特征。

3)判断实例是否属于问题。制作一个包含一个类和所有训练集实例的模型。如果要分类的实例是异常值,则停止。否则,使用包含所有类的第二个 SVM 进行分类。

关键词是“级联SVM”

于 2013-10-15T19:14:30.893 回答