0

我有一个问题,希望有人能帮我弄清楚。我正在尝试在 iPython 笔记本中构建两个不同的并行视图。第一个视图包含 ID 为 0 的处理器,第二个视图包含所有其余的处理器。我为每个视图关联了一个前缀,这样我就可以轻松地在不同的处理器上运行不同的东西。

我启动了一个后台线程,该线程使用第二个视图中的处理器进行长时间计算。当它在后台运行时,我尝试使用第一个视图运行命令,但它不起作用。我收到此错误:ValueError:''不在列表中。

所以我想知道是否有办法做我想做的事情,或者这是否是不受支持的行为。简而言之,我想使用不同的处理器创建两个不同的视图。视图之间不会共享处理器。然后我希望能够运行使用一个视图的后台任务,同时将另一个视图用于不相关的任务。

这是一个导致错误的小示例脚本。我不确定如何直接发布笔记本,所以我只是复制并粘贴了从中生成的 python 脚本。

# <codecell>

from IPython import parallel
cli = parallel.Client()

# <codecell>

view1 = cli[0]
view1.block = True
view1.activate("_one")

# <codecell>

view2 = cli[1:]
view2.block = True
view2.activate("_two")

# <codecell>

%px_two import time
def backFunc():
    for i in range(10):
        %px_two time.sleep(5)
        %px_two print "In bg thread"

# <codecell>

from IPython.lib import backgroundjobs as bg
bgJob = bg.BackgroundJobManager()
bgJob.new('backFunc()')

# <codecell>

%px_one import time
def foreFunc():
    for i in range(10):
        %px_one time.sleep(1)
        %px_one print "In fg thread"


# <codecell>

foreFunc()

一旦 foreFunc() 运行,它就会给出错误:

ValueError: '<IDS|MSG>' is not in list

有什么想法吗?我会很感激任何人的任何想法。

4

1 回答 1

1

简答

客户端使用的套接字不是线程安全的,因此您不能在多个线程中同时使用它们。您可以同时使用集群,但您需要为后台任务创建一个单独的客户端,该客户端将拥有自己的一组套接字:

rc = parallel.Client()
rc2 = parallel.Client()

view1 = rc[0]
view2 = rc2[1:]

其余的应该按预期工作。

PS:这是怎么回事

Client 对象主要是围绕套接字集合的 API。每个客户端都有自己的一组套接字,一个客户端上的所有视图都使用相同的套接字。当您跨线程共享这些套接字时,一个线程可能会获得用于另一个线程的消息的一部分,从而混淆消息。

每条消息实际上是一个多部分消息 zeromq 消息,通过zmq.Socket.send/recv_multipart发送或接收,相当于:

multipart = []
for i in range(nparts):
    multipart.append(socket.send/recv())

如果两个线程同时在同一个套接字上执行此操作,则消息可能会交错,因此不会收到两条消息:

['a1', 'a2', 'a3'], ['b1', 'b2', 'b3']

我们得到

['a1', 'a2', 'b1', 'b2', 'b3'], ['a3']

导致您看到的问题。最简单的解决方法是在不同的线程中使用不同的套接字。另一种解决方法是使用锁定来确保以原子方式接收多部分消息。每个线程分离套接字可以避免锁定的需要,但它确实增加了您需要使用的套接字数量与并发线程的数量成正比。

PPS ...但 IPython.parallel 是异步的

最后我会问你为什么要使用后台作业。您不需要使用线程来完成您描述的任务,因为客户端通常不会等待引擎的结果。IPython.parallel 本质上是异步的,因此您无需等待作业完成即可提交新作业,或在交互式会话中本地工作。我通常不建议将block=True其用于调试以外的任何用途。

于 2014-12-01T22:50:37.930 回答