0

[我很难在 Linux 上使用 python 3 实现线程/进程安全的解决方案来获取文件锁(我不关心可移植的解决方案,因为我正在开发的程序广泛使用 Linux 内核-专有容器化技术)。]

阅读http://apenwarr.ca/log/?m=201012#13后,我决定使用fcntl.lockf()锁定文件以进行进程独占访问并编写以下函数:

import contextlib as Contextlib
import errno as Errno
import fcntl as Fcntl
import os as Os


@Contextlib.contextmanager
def exclusiveOpen(filename,
                  mode):
  try:
    fileDescriptor = Os.open(filename,
                             Os.O_WRONLY | Os.O_CREAT)
  except OSError as e:
    if not e.errno == Errno.EEXIST:
      raise

  try:
    Fcntl.lockf(fileDescriptor,
                Fcntl.LOCK_EX)
    fileObject = Os.fdopen(fileDescriptor,
                           mode)

    try:
      yield fileObject
    finally:
      fileObject.flush()
      Os.fdatasync(fileDescriptor)
  finally:
    Os.close(fileDescriptor)

除此之外,我确信它是不正确的(为什么它不阻塞Fcntl.lockf(fileDescriptor, Fcntl.LOCK_EX)?),最让我感到不安的部分fileDescriptor是获取文件的位置 - 如果文件不存在,则创建它.. . 但是,如果两个进程同时执行这部分,会发生什么?是否存在竞争条件,两个线程都尝试创建文件?如果是这样,人们怎么可能阻止这种情况 - 当然不是使用另一个锁定文件(?),因为它必须以相同的方式创建(?!?!)我迷路了。任何帮助是极大的赞赏。

更新:发布了解决潜在问题的另一种方法。我在这种方法中看到的问题是,过程名称不能等于现有 UNIX 域套接字的名称(可能由另一个程序创建)——我对此是否正确?

4

2 回答 2

1

AFAIK,创建文件时没有可能的竞争条件。如果两个(或更多)进程或线程尝试open使用O_CREAT标志而不是O_EXCL一个同时创建同一个文件,则该文件将被创建一次,并且所有调用者将在同一个文件上获得一个打开的文件描述符 - 正是您所需要的. 我假设您在 Linux 上使用 C-Python,并且您的 Python 代码将使用底层 C open 函数结束。

因此,当您的代码执行该lockf函数时,您在现有文件上有一个打开的文件描述符,因此如果lockf底层文件系统支持锁定,则底层调用保证一次只有一个进程可以持有锁。

我在 Unix (FreeBSD) 系统上尝试过它,它按预期工作。

于 2016-04-26T13:59:57.203 回答
-1

基于https://stackoverflow.com/a/7758075/5449837,我最终使用抽象的 UNIX 套接字而不是锁定文件来同步进程(如果有人发布更好的答案,我会很乐意接受)。

import contextlib as Contextlib
import os as Os
import socket as Socket
import time as Time


@Contextlib.contextmanager
def locked(name,
           timeout):
  try:
    lock = Socket.socket(Socket.AF_UNIX, 
                         Socket.SOCK_DGRAM)

    while True:
      try:
        lock.bind('\0' + name)
        break
      except:
        if timeout:
          Time.sleep(1)
          timeout = timeout - 1 
        else:
          raise

    yield
  except:
    raise
  finally:
    lock.close()


# usage:
with locked("procedureName", 5):
  pass # perform actions on shared resource

对反对者:愿意解释一下为什么你认为这很糟糕吗?

于 2016-04-26T00:47:08.663 回答