4

我正在尝试使用 R 中的 kernlab 库(ksvm 函数)来实现新颖性检测器。这是我正在尝试做的一个简单示例:

# Training data
xxTrain <- matrix(rnorm(2000), nrow=1000, ncol=2, byrow=TRUE)
y <- rep(1,1000)
classifier <- ksvm(xxTrain, y, type="one-svc", kernel="rbfdot", kpar="automatic")
# Test data
x1 <- rnorm(1000)
scale <- c(rep(1,500), rep(10,100), rep(1,400))
x2 <- rnorm(1000)*scale
xxTest <- matrix(c(x1,x2), nrow=1000, ncol=2, byrow=TRUE)
# Prediction
p <- predict(classifier, xxTest, type="response")
# Visualization
plot(x2, type='l')
lines(x1, col="red")
points(5*as.integer(p), type='l', col="blue")

在此处输入图像描述

上图是我得到的结果。蓝色迹线是预测,它清楚地显示了一个始终为 0 的周期。但它与黑色迹线中的异常值在时间或宽度上不匹配。有100个幅度较大的点(黑线),我得到的蓝色输出与黑线不匹配。

我究竟做错了什么?

4

1 回答 1

1

这是你做错了什么:

xxTest <- matrix(c(x1,x2), nrow=1000, ncol=2, byrow=TRUE)

这应该是

xxTest <- matrix(c(x1,x2), nrow=1000, ncol=2, byrow=F )

或更好

xxTest <- cbind( x1, x2 )

或者干脆

p <- predict( classifier, cbind( x1, x2 ), type= "response" )

结果(我已将灰色用于 x2):

在此处输入图像描述

解释:通过指定byrow=T,您首先取 x1 的元素来填充前 500 行(或者,第 1 列和第 2 列),然后用 x2 填充剩余的 500 行xxTest。由于 x2 中的奇点约为 500 - 600,因此它出现在xxTest(500+500)/2 - (500+600)/2 左右的两列中,即 750-800,这是你可以看到的。

于 2012-10-17T11:05:26.893 回答