pycaret - PyCaret predict_model() 方法失败并出现 Pipeline not Found 错误

Question

我已经在本地训练了我的 pycaret 模型，然后我把它推到了 S3。现在我想在我更大的生产数据集上运行 predict_model() 方法。

使用 boto3，我将模型 pickle 文件从 S3 复制到 Spark EMR 集群的主节点。然后我使用导入库

from pycaret.classification import *

并尝试应用我的预测如下 -

model_path = '/tmp/catboost_model_aug19'
saved_model = load_model(model_path)  
Transformation Pipeline and Model Successfully Loaded
new_data = spark.sql("select * from table").toPandas()
df = predict_model(saved_model, data = new_data)

当我运行predict_model()它时出错说Pipeline not found

或者，当我在本地机器上运行相同的代码时，它工作正常。如何解决此错误？

score 1 · Accepted Answer

什么版本的 Pycaret 用于模型创建？我遇到了类似的错误，结果发现腌制模型是基于以前版本的 pycaret 构建的，而我拥有的是最新版本。

pycaret - PyCaret predict_model() 方法失败并出现 Pipeline not Found 错误

1 回答 1

Related

Reference