如何限制正在使用的内核/线程/进程的数量vaex
?一些操作有一个布尔parallel
开关,但我没有看到一种方法来进行更细粒度的控制(这在更大的共享服务器上很重要)。
手头的代码片段:
vaex.open("/very/large/file.parquet/")\
.sample(frac=0.01)\
.export_parquet("/slightly/smaller/file.parquet", parallel=True)
如何限制正在使用的内核/线程/进程的数量vaex
?一些操作有一个布尔parallel
开关,但我没有看到一种方法来进行更细粒度的控制(这在更大的共享服务器上很重要)。
手头的代码片段:
vaex.open("/very/large/file.parquet/")\
.sample(frac=0.01)\
.export_parquet("/slightly/smaller/file.parquet", parallel=True)