好的,这是一个解决方案的尝试。
基本技巧是这样的:我们光栅化两条曲线,然后我们可以逐块地进行曲线比较。至少,这似乎是比较曲线叠加的一种相当合理的方式。为了鼓励优化器接近曲线,我们还引入了一个损失来惩罚离另一条曲线太远的曲线。
不能保证这适用于更复杂的曲线和变换,但至少这是一个想法。
curve2<-data.frame(x=c(4,5,5,6,6,7),
y=c(2,2,1,1,2,3))
fillin <- function(ax, ay, bx, by, scaling= 10, steps= 100) floor(cbind(seq(from = ax, to = bx, len = steps), seq(from = ay, to = by, len = steps)) * scaling)
Bmat <- matrix(0, 100, 100)
for (i in 2:nrow(curve2)){
Bmat[fillin (curve2[i-1,1], curve2[i-1,2], curve2[i,1], curve2[i,2])] =1
}
Bmat.orig = Bmat
Bmat = Bmat.orig
#construct utility function based on
#manhattan distances to closest point?
shift = function(mat, offset){
mat0 = array(0, dim = dim(mat)+2)
mat0[1:nrow(mat) +1+ offset[1] , 1:ncol(mat) + 1+offset[2]] = mat
return(mat0[1:nrow(mat) + 1, 1:ncol(mat) + 1])
}
for (i in 1:100){
Bm = (Bmat != 0)
Btmp1 = shift(Bm, c(1,0))
Btmp2 = shift(Bm, c(-1,0))
Btmp3 = shift(Bm, c(0,1))
Btmp4 = shift(Bm, c(0,-1))
Bmat = Bmat + pmax(Bm ,Btmp1, Btmp2, Btmp3, Btmp4)/i
}
Bmat2 = replace(Bmat, Bmat == max(Bmat), max(Bmat) + 10)
#construct and compare rasterised versions
getcurve = function(trans = c(0,1), curve=data.frame(x=c(1,1,2,2,3) ,
y=c(9,6,6,3,3) ), Bmat = Bmat2){
Amat = array(0, dim = dim(Bmat))
curve[,1] = curve[,1] + trans[1]
curve[,2] = curve[,2] * trans[2]
for (i in 2:nrow(curve)){
fillin (curve[i-1,1], curve[i-1,2], curve[i,1], curve[i,2]) -> ind
if (min(ind) < 1 || max(ind) > nrow(Bmat)) return( array(-1, dim= dim(Bmat)))
Amat[ind] =1
}
Amat = (Amat - mean(Amat))/sd(as.vector(Amat))
Amat
}
compcurve = function(trans = c(0,1), curve=data.frame(x=c(1,1,2,2,3) ,
y=c(9,6,6,3,3) ) , Bmat = Bmat2){
Amat = getcurve(trans, curve, Bmat)
-sum(Amat * Bmat)
}
#SANN seems to work for this, but is slow. Beware of finite differencing
# - criterion is non-smooth!
optim(c(0,1), compcurve, method = "SANN", Bmat = Bmat2) -> output
image(Bmat)
contour(getcurve(output$par), add = T)
结果:
不会太破旧吧?
您可能不得不捏造光栅化的细节来解决其他问题。你可能想调整优化的完成方式。
一个“更聪明”的替代方法是注意,对于最佳解决方案,可能至少有一对顶点会重合。这可以为您提供更好的搜索策略。与曲线之间的区域相比,光栅化方案的优势在于它可能更灵活地处理不同的转换和非图形(特别是,第一条曲线中的垂直线是一个问题。)您可以潜在地避免光栅化适当的计算,但只是想想就让我头疼。
由于我们正在最大化标准,因此这是一种最大似然方法。奇怪的是,我认为实际上不可能使用正态错误将这个问题表述为最大似然问题,因为正态错误意味着基于 L2 的标准,众所周知,这不会给你精确的叠加。