我有一个包含 500 个输入文件的文件夹(所有文件的总大小约为 500 [MB])。
我想编写一个python
执行以下操作的脚本:
(1)将所有输入文件加载到内存
(2)python
初始化一个稍后将使用的空列表...参见项目符号(4)
(3)启动 15 个不同的(独立的)进程:每个进程都使用相同的输入数据 [from (1)
] -- 但使用不同的算法对其进行处理,从而产生不同的结果
(4)我希望 [来自步骤(3)
] 的所有独立进程将它们的输出存储在同一个python
列表中 [在步骤 中初始化的相同列表(2)
]
一旦所有 15 个进程都完成了它们的运行,我将拥有one python list
包括所有 15 个独立进程的结果。
我的问题是,是否可以有效地完成上述工作python
?如果是这样,您能否提供一个方案/示例代码来说明如何做到这一点?
注意#1:我将在强大的多核服务器上运行它;所以这里的目标是使用所有处理能力,同时在所有独立进程之间共享一些内存 { input data
, }。output list
注意#2:我在一个Linux
环境中工作