我有一个带有二进制这些字符串的数据库
record no 1: 1111111111111011000100110001100100010000000000000011000000000000
record no 2: 1111111111111111111111100001100000010000000000000011000000000000
record no 3: 1110000011110000111010001110111011110000111100001100000011000000
...
所以,我想找出什么记录有类似的二进制字符串:1111111111111011000100110001100100010000000000000011000000001100
可以看到,记录号 1 的相关性是 98%。记录号 2 的相关性为 70%,记录号 3 的相关性仅为 45%。
这是一个巨大的数据库(200.000 条记录)......