我已经从 0 和 1 构建了序列。我想以某种方式测量它们与目标字符串的距离。但目标字符串不完整。
我拥有的数据示例,其中 x 是目标字符串,其中 [0] 表示至少出现一个'0'
:
x =11[0]1111[0]1111111[0]1[0]`, the length of x is fixed and eaquel to length of y.
y1=11110111111000000101010110101010111
y2=01101000011100001101010101101010010
all y's have the same length
很容易看出这x
确实可以解释为一组字符串,但是这个集合可能非常大,也许我只需要从那个集合中采样并取最小编辑距离的平均值,但这又是一个太大的计算问题。
我试图弄清楚算法,但我被堆叠了,它的步骤如下所示:x - 目标字符串 - 模糊之一,
y - 第二个字符串 - 固定 Cx1, Cy1 - x 和 y 中的个数 Gx1, Gy1 - 向量列表,每个列表的长度等于给定序列中的组数,
Gx1[i] 第 i 个向量,
Gx1[i]=(第i组的第一个,第i组的长度)
如果 Gx1 和 Gy1 的长度相同,那么我们知道要从每个组中添加或删除多少个,但是有一个问题,因为我不知道简单的添加和删除是否会给出最小距离