python - 解决 ktrain 预测器与学习器预测的速度差异？

Question

我正在使用 ktrain huggingface 库来构建语言模型。我注意到，在将其用于生产时，“学习者预测”与“预测者预测”的速度存在巨大差异。为什么以及有什么方法可以加快预测器的预测速度？

%timeit test = learner.predict(val) # takes 10s
%timeit test = predictor.predict(x_val,return_proba = True) # takes 25s

score 0 · Accepted Answer

第二个调用预处理数据（例如，标记化），而第一个调用对已经预处理的数据进行预测。因此，时间差异可能是由于预处理原始数据所花费的时间：

%%time
tst = predictor.preproc.preprocess_test(x_test)
# Wall time: 5.65 s

%%time 
preds = learner.predict(val)
# Wall time: 10.5 s

%%time
preds = predictor.predict(x_test)
# Wall time: 16.1 s

向提供文本列表时predict，您还可以使用更大的文本，batch_size这也可能有助于提高速度（默认值为 32）：

predictor.batch_size = 128
preds = predictor.predict(x_test)

最后，如果您希望在部署场景中做出更快的预测，您可以查看ktrain FAQ，其中展示了如何使用 ONNX 进行量化预测和预测。

python - 解决 ktrain 预测器与学习器预测的速度差异？

1 回答 1

Related

Reference