我有超过十亿个代表用户名的唯一字符串,我每隔几分钟就会同时添加数百万个字符串,超过 50% 是重复的。我目前正在使用带有 mySQL 的 InnoDB 表。我正在使用 INSERT IGNORE 但服务器根本无法跟上同时添加数百万的负载(使用超大 CPU EC2 实例)。为了解决这个问题,我将用户名批量存储,并在可能的情况下使用服务更新唯一表。
我愿意接受任何可以在 ec2 实例上进行合理设置的建议。也许redis可以实现我想做的但我还没有使用它。任何人都可以建议在插入数百万个字符串的同时存储超过十亿个唯一字符串的最有效方法吗?