我之前写过一个提要聚合器,但正在尝试对其进行一些优化。过去,使用 simplepie(php 类)解析提要,我使用 get_id() 函数为每个提要项返回一个哈希值(链接 + 标题的 md5 组合)。我将此“id”存储为 MySQL 中的“remote_id”。但是,为了确保没有重复项,我一直在对每个提要项目进行 SELECT 查询,以确保“remote_id”不存在。考虑到我正在查看 1000 个提要,这似乎效率低下。
将 remote_id 转换为唯一键然后让数据库在每次传递时都无法写入新记录是最有效的吗?还有其他更好的设计方法吗?