Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在做一个 RSS 蜘蛛。您如何控制上次抓取日期?
现在我在想的是这样的:
其他人如何解决这个问题?
我将所有数据存储在数据库中(包括上次抓取日期和发布日期),并从数据库中获取我需要的所有日期。
我也将所有数据存储在数据库中,并从数据中计算出哈希值。这样,您可以非常快速地查找哈希,并即时执行重复数据删除操作。