1

我正在尝试以特定方式比较两个文本文件。每个文件都包含数千行,如下所示:

(29, '2 [484, 41, 69, 72]')

其中,29是,里面的四个值是是 的值。在这种情况下,。frame2ID[]rectX,Y,W,HX = 484, Y = 41, W = 69, H = 72

每个都可以附加frame多个。rects从 1 到 20 甚至更多。

以下是我需要比较的两个文件的示例:

档案一:

http://pastebin.com/qGLvxU1f

文件 B:

http://pastebin.com/1aKw6iuH

现在对于比较方法,我需要使用以下等式比较rects所有的:frame

(overlap)/(two rects area - overlap) > Threshold

其中 Threshold 手动定义为 0.8 左右。

在我确定了其中的哪些frames包含在两个文件之间有所不同之后,我需要将每个 ID 的和(使用上述等式)rects写入第三个文件,这些ID 产生了足够显着的差异。start frameend frame

我正在尝试逐行比较:

 def _compare(self, data1, data2):
        diff = []
        for frame in data1.keys():
            if frame in data2.keys():
                data1.pop(frame)
                data2.pop(frame)
        return diff
        with open(out_file, 'w') as f:
            f.write('\n'.join(diff))

但这只是确定某一行是否有差异,并不会比较每一行的实际值rect

4

1 回答 1

1

我认为您应该从这些矩形创建一个类,以便您可以将 (x,y) 值存储为偏移量,并将 (w,h) 值存储为大小。然后你应该向这些类添加函数,例如:toplef、topright、bottomlef、bottomright,它会计算你需要的值。

例如:

    class rectangle:
def __init__(self,pos,size):
    self.pos=pos
    self.size=size
def topLeft(self):
    return self.pos
def topRight(self):
    return (self.pos[0]+self.size[0],self.pos[1])
def bottomLeft(self):
    return (self.pos[0],self.pos[1]+self.size[1])
def bottomRight(self):
    return (self.pos[0]+self.size[0],self.pos[1]+self.size[1])
def ares(self):
    return self.size[0]*self.size[1]

计算重叠区域比我最初想的要复杂,但我找到了一个解决方案,可以相对容易地实现(但现在我没有时间实现它)。主要思想是,您确定第三个矩形,其中包含两个矩形(很简单,您只需找到最小的左上角和最大的右下角坐标)。然后你必须计算剩下的矩形的 ara。然后你把剩下的四个矩形的面积相加,两个初始矩形,如果你减去大矩形的面积,你会得到重叠的面积。我知道这听起来很复杂,但这是一个通用的解决方案。

在此处输入图像描述

于 2013-06-15T13:47:50.100 回答