0

我有一个项目数据库表,我们称它们为游戏。每个游戏都有一个发布日期

我运行一个随机选择游戏的脚本,并从我的源数据中更新各种信息,例如价格等。这个脚本在一个 cron 上,全天定期触发

有 20,000 多条游戏记录并且还在不断增长,因此很明显,这些游戏中的一些保持最新状态比其他游戏更重要。这主要基于发布日期,但也可能包括其他领域的数据。

有什么方法可以让我的批处理脚本根据这个重要性选择一条记录,而不必遍历所有结果,直到每个结果都被更新然后从顶部开始?

那么重要游戏的更新频率会高于不重要的游戏吗?

4

1 回答 1

0

正如@Usman 提到的,您需要定义一种可以正常工作的衡量重要性的方法。然后,我的建议是让您的脚本每次运行时更新两条记录。您将从“重要”记录中随机选择其中一条记录,并从所有记录中随机选择另一条记录。

这样您就不会降低更新任何给定记录的可能性,同时您会增加更新重要记录的可能性。

但是,您知道,即使您每秒运行一次随机更新脚本,也不能保证您每天都能获得全部 20,000 条记录。您一周不更新的游戏迷可能会对您的数据过时感到恼火。最好按固定时间表更新内容,或者在获得新数据时进行更新,而不是随机更新。

于 2012-08-02T18:47:19.183 回答