1

如果我为您提供了足以将一堆对象分类为苹果、橙子或香蕉的数据,那么您需要多长时间才能构建一个可以进行分类的 SVM?我很欣赏这可能取决于数据的性质,但我们更有可能谈论几个小时、几天或几周?

好的。既然您拥有了该 SVM,并且您了解了数据的行为方式,那么您可能需要多长时间来升级该 SVM(或构建一个新的)以对额外的类(西红柿)进行分类?秒?分钟?小时?

这个问题的动机是试图评估支持向量机在并非所有数据都可以随时采样的情况下的实际适用性。水果是一个明显的例子——它们随着季节的变化而改变颜色和可用性。

如果您期望 SVM 过于繁琐,无法在 5 分钟内按需创建,尽管有问题域方面的经验,那么对于这种情况的更用户友好的分类器形式的建议将不胜感激。

4

2 回答 2

1

通常,将类添加到 1 vs. many SVM 分类器需要重新训练所有类。在大型数据集的情况下,这可能会变得非常昂贵。在现实世界中,当面对非常大的数据集时,如果性能和灵活性比 state-of-the-art 的准确性更重要,朴素贝叶斯的使用相当广泛(在 NB 分类器中添加一个类只需要训练新类)。

但是,根据您的评论,其中指出数据有几十个维度和多达 1000 个样本,问题相对较小,因此实际上,SVM 重新训练可以非常快地执行(可能在几秒到几十秒的数量级) )。

于 2013-03-05T08:54:34.297 回答
0

您需要向我们提供有关您的问题的更多详细信息,因为有太多不同的场景可以相当快地训练 SVM(我可以在第三人称射击游戏中实时训练它并且没有任何延迟)或者它可以持续几个分钟(我有一个人脸检测器的案例,训练需要一个小时)

作为一个经验法则,训练时间与样本数量和每个向量的维度成正比。

于 2013-03-05T05:17:11.007 回答