我正在编写一个简单的工具来检查重复文件(即具有相同数据的文件)。该机制是使用 sha-512 算法为每个文件生成哈希,然后将这些哈希存储在 MYSQL 数据库中。我将哈希存储在 binary(64) 唯一的非空列中。每行都有一个唯一的二进制哈希,用于检查文件是否重复。
-- 我的问题是 --
我可以在二进制列上使用索引吗,我的默认表排序规则是 latin1 - 默认排序规则?
为了获得高性能,我应该使用 Btree 或 Hash 哪种索引机制?我需要每秒更新或添加 100 行。
为了获得最佳性能,我还应该注意哪些其他事项?