基本上,我希望我的网站在 cron 作业期间聚合大量 rss 提要并将它们存储在数据库中。我使用 magpie 将 rss 解析为数组……虽然我担心在运行 cron 作业时出现重复问题,但一切都应该是直截了当的。
避免重复条目的最佳解决方案是什么……这是我的理论,尽管我认为它没有效率。
cron工作理论
1) 使用 magpie 解析 rss 提要 2) 创建链接的 md5 哈希 3) 测试数据库表中 md5 的存在...如果不存在...插入 .. 如果存在忽略或更新
让我知道是否有更有效的方法