我正在尝试通过利用 Ktrain 包装器来解决 BERT 的多类分类问题。有大量数据,我想知道是否可以并行化 learner.fit_onecycle(3e-4, 5) 函数或 autofit() 函数。
例如,在 sklerarn 中,您可以使用 n_jobs 参数指定并行作业的数量。
你可以帮助我?谢谢
我正在尝试通过利用 Ktrain 包装器来解决 BERT 的多类分类问题。有大量数据,我想知道是否可以并行化 learner.fit_onecycle(3e-4, 5) 函数或 autofit() 函数。
例如,在 sklerarn 中,您可以使用 n_jobs 参数指定并行作业的数量。
你可以帮助我?谢谢
首先,如果你在ktrain中使用 DistilBert 而不是 BERT ,它会将你的训练时间缩短一半。其次,在使用 CPU调用ktrain中的任何fit方法时,TensorFlow2 应该默认使用多个内核。如果需要,您可以控制 CPU 内核的数量。