3

这是我的第一个线程程序。我在这里面临一个奇怪的问题。我正在构建一个简单的调度程序,如 Django 中的应用程序,其中函数名称(定期执行)将与它们的下一个执行时间一起存储在 Django 模型中。
执行管理命令以启动一个连续运行的线程,以检查是否有任何功能的执行到期,如果是,则启动一个新线程来执行该功能。这样,为每个函数创建了单独的线程(至少,这就是想法!)。

class Command(BaseCommand):

    def __init__(self):
        super(Command, self).__init__()
        self.lock = None

    def handle(self, *args, **kwargs):
        self.lock = threading.RLock()
        t1 = threading.Thread(target=self.cron_thread)
        t1.start()
        t1.join()

    def cron_thread(self):
        while True:
            # Fetch only Active records
            scheduled_actions = Scheduler.objects.filter(active=True)
            for scheduled_action in scheduled_actions:
                # check if execution is due
                if scheduled_action.next_execution_time == datetime.now():
                    # creating a new thread
                    function_thread = threading.Thread(target=eval(scheduled_action.function_name), args=[self.lock])
                    function_thread.start()
                    function_thread.join()
                    scheduled_action.next_execution_time = local_timezone.localize(datetime.now() + relativedelta(minutes=scheduled_action.interval))
                    scheduled_action.run_now = False
                    scheduled_action.save()

    def somefunction(self):
        self.lock.acquire()
        # function body
        self.lock.release()

我为开始执行整个程序而创建的命令是: python3 manage.py runcrons-debit

执行此命令后,我可以在htop结果中看到两个进程正在运行,并且消耗了几乎 80% 的 CPU,如下图所示: 查看图片 请注意,这里还没有任何调度程序记录处于活动状态。

当调度程序记录被激活并且函数实际运行时,htop中显示的进程增加到三个,CPU 使用率急剧下降到 0.0%。如下图所示: 查看图片

这里有两点看不懂,

  • 一旦函数的执行结束并且没有正在执行的函数,htop 结果将返回到消耗几乎 80-90% CPU 的两个进程。为什么这里的空闲线程会消耗这么多 CPU?
  • 另外,当没有执行任何功能时,为什么仍然显示两个进程?我可以理解其中一个是命令本身,但是是什么导致创建第二个进程?

  • 4

    1 回答 1

    4

    cron_thread有一个无限循环。此循环首先检索计划的操作,然后循环它们。对于每个操作,如果该操作被安排在当前的确切时间,则执行该操作。

    如果没有安排任何动作,则循环将一遍又一遍地继续检索已安排的动作。如果有一个动作,它会检查现在是否是执行它的时间。这是另一个问题:datetime.datetime.now()具有非常高的精度(最近的微秒),因此它与操作的预定时间匹配的机会非常低。这意味着您的循环将检索所有计划的操作,循环所有操作,然后返回顶部。

    如果计划动作的时间与当前时间不匹配,则将执行该动作,然后内部循环移动到下一个动作。当它遍历所有动作时,它将返回顶部并再次检索所有动作。

    基本上,您的程序会不断地将任何计划的操作与当前时间进行比较。这需要处理能力。执行这些操作的更好方法是检查每个新操作的时间,因为它被添加到任务列表中,计算必要的延迟,直到需要执行该操作,然后设置一个计时器以在必要后执行该操作延迟(time.sleep在线程中,after调用tkinter,诸如此类)。

    于 2019-01-25T15:04:54.170 回答