我正在寻找一种可以将每个字符串编码为唯一数字的编码,这样 ->
- 每两个相似的字符串必须具有彼此接近的值。
- 每两个彼此接近的值必须代表相似的字符串。
字符串的相似性意味着一个字符串中的一些替换可以形成另一个字符串。不考虑添加或删除。
字符串只能有字符 A、C、T 和 G(只有四种可能)
我尝试过的事情->
格雷码 -> 满足第二个条件但不满足第一个条件。相似的两个字符串并不意味着它们在格雷码中具有更接近的值。
与参考字符串的汉明距离 -> 显然,如果汉明距离相同,则根本不意味着字符串相似,只是它们与参考字符串的距离相同。所以它不满足第二个标准。
如果您知道任何针对此特定问题的方法,请提出一种方法。