Disclamer:我是 SCOOP 的开发者。
这真的取决于你的个性。如果您更喜欢在继续前进之前获得理论信息,您应该先阅读一些书籍或了解技术。涵盖该主题大部分内容的书籍清单将是:
- Thomas Rauber 和 Gudula Rünger (Springer-Verlag)的多核和集群系统的并行编程。
- Calvin Lin 和 Lawrence Snyder (Addison-Wesley)的并行编程原理
- Timothy G. Mattson 等人的并行编程模式。(艾迪生-韦斯利)
您可能想要熟悉的基于数据的技术将是 MPI 标准(用于多台计算机)和 OpenMP(用于单台计算机),以及 Python 中内置的相当不错的多处理模块。
如果你喜欢先动手,你应该从基于任务的框架开始,它提供了一个简单和用户友好的用法。在创建SCOOP时,这两个都是最大的焦点。你可以用pip -U scoop
. 在 Windows 上,您可能希望首先使用其可执行安装程序安装 PyZMQ 。您可以检查提供的示例并使用各种参数来轻松了解导致性能下降或提高的原因。我鼓励你将它与它的替代品进行比较,例如用于类似工作的Celery或用于协程框架的Gevent 。如果您喜欢冒险,请不要羞于测试内置的协程功能Python 并将它们插入各种网络堆栈。
使用基于任务的框架将减轻您的理论分析负担,例如负载平衡实现细节、序列化等,这些都是非常重要的,并且可能需要很长时间才能调试和开始工作。它提供了对分布式系统的所有期望级别的理解。开源软件的好处:检查代码以了解引擎盖下的机械细节。