问题标签 [pycaret]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
338 浏览

python - 使用 FastAPI 为使用 pycaret 生成的分类模型构建 API

我使用 pycaret 作为我的 ML 工作流程,我尝试使用 FastAPI 创建一个 API。这是我第一次进入生产级别,所以我对 API 有点困惑

我有 10 个特征;年龄:float,live_province:str,live_city:str,live_area_big:str,live_area_small:str,sex:float,marital:float,bank:str,salary:float,amount:float和一个标签,其中包含二进制值(0和 1)。

这就是我构建 API 的脚本

当我尝试运行uvicorn script:app并转到文档时,我找不到我的功能的参数,参数只显示模型和 input_dict 在此处输入图像描述

如何将我的功能带到 API 中的参数上?

0 投票
1 回答
600 浏览

python - 尝试将 model.pickle 加载到 API 但引发 ```AttributeError: 'Data' object has no attribute 'columns'```

我已经使用 pycaret 构建了一个分类模型,并且已经生成了 pickle 文件。然后,我尝试构建一个 API 并使用 fastapi 加载 pickle 文件。

api 运行完美,但事情是当我尝试测试 api 并根据它返回的功能为其提供输入时:

!fastapi 文档的输出 在此处输入图像描述

我认为问题在于我将泡菜加载到 API 中的方式。你们能给我建议加载泡菜的正确方法吗?

0 投票
0 回答
141 浏览

pycaret - Pycaret 异常 Plot_model

我正在使用 Pycaret 中的异常模块。这是一个令人印象深刻的程序并且易于使用。

plot_model(knn, plot="umap", save=True)产生一个很好的 umap 图,见 pdf。此交互式绘图通过悬停标识x=0y=1坐标。

我想将x=0y=1作为主要数据来手动对组进行聚类。'assign' 中的 df 没有给出这个。只有一个值“分数”。

有没有办法识别x=0y=1坐标以便我可以导出它们?

谢谢

0 投票
1 回答
455 浏览

pycaret - PyCaret predict_model() 方法失败并出现 Pipeline not Found 错误

我已经在本地训练了我的 pycaret 模型,然后我把它推到了 S3。现在我想在我更大的生产数据集上运行 predict_model() 方法。

使用 boto3,我将模型 pickle 文件从 S3 复制到 Spark EMR 集群的主节点。然后我使用导入库

from pycaret.classification import *

并尝试应用我的预测如下 -

当我运行predict_model()它时出错说Pipeline not found

或者,当我在本地机器上运行相同的代码时,它工作正常。如何解决此错误?

0 投票
3 回答
6270 浏览

python - 在 Jupyter 中导入 PyCaret 时找不到模块

我正在尝试学习 PyCaret,但在尝试将其导入 Jupyter Lab 时遇到问题。

我在 virtualenv 中工作并通过 pip 安装了 pycaret:

我可以通过以下方式确认其安装pip list

笔记本的第一行是:

但这会导致:

我正在努力解决这个问题,但找不到其他有类似情况的人。我也尝试通过 python shell 导入,并且效果很好。

0 投票
1 回答
99 浏览

machine-learning - 在大型数据集上训练异常检测模型并选择正确的模型

我们正在尝试为应用程序日志构建异常检测模型。

预处理已经完成,我们已经构建了自己的 word2vec 模型,该模型在应用程序日志条目上进行了训练。

现在我们有一个 150 万行 * 100 列的训练数据

其中每一行是日志条目的向量化表示(每个向量的长度为 100,因此为 100 列)

问题是大多数异常检测算法(LOF、SOS、SOD、SVM)都没有针对这个数据量进行扩展。我们将训练规模减少到 500K,但这些算法仍然挂起。在 POC 样本数据上表现最好的 SVM,没有让 n_jobs 在多个内核上运行它的选项。

一些算法能够完成,例如隔离森林(具有低 n_estimators)、直方图和聚类。但是这些无法检测到我们故意放入训练数据的异常情况。

有人知道我们如何为大型数据集运行异常检测算法吗?

在标准异常检测技术中找不到批量训练的任何选项。我们应该研究一下神经网络(自动编码器)吗?

选择最佳模型:

鉴于这是无监督学习,我们选择模型的方法如下:

在日志条目训练数据中,插入小说中的条目(比如指环王)。此日志条目的向量表示将不同于日志条目的其余部分。

在各种异常检测算法上运行数据集时,查看哪些算法能够检测到小说中的条目(这是异常)。

当我们尝试在一个非常小的数据集(1000 个条目)上运行异常检测时,这种方法很有效,其中日志文件使用 google 提供的 word2vec 模型进行了矢量化。

这种方法合理吗?我们也对其他想法持开放态度。鉴于它是一种无监督学习算法,我们必须输入一个异常条目并查看哪个模型能够识别它。

投入的污染比例为 0.003

0 投票
1 回答
328 浏览

jupyter-notebook - PyCaret - 如何在 Spyder 中获得与 Jupyter Notebook 类似的输出

我正在 Spyder 中运行 PyCaret 的设置和比较功能。根据 PyCaret 文档,总是有一个网格作为输出结果。我意识到文档认为代码在 Jyputer Notebook 中运行是理所当然的。

我使用 Spyder 作为机器学习问题的 IDE,我看到运行上述函数后,没有输出结果。

是否有任何解决方法可以继续使用 Spyder?

0 投票
1 回答
924 浏览

python - 有没有办法返回由 Pycaret 调整的超参数?

Pycaret 自动搜索最佳参数。例如,下面的代码会将 5 个自动调整的模型分配给“tuned_top5”。

然而,这对我来说还不够。我想知道超参数的确切名称和值。例如,如果此代码将 max_depth 调整为 9,我希望打印“max_depth=9”或类似的结果。

有没有办法做到这一点?

0 投票
1 回答
1253 浏览

python - ImportError: cannot import name 'doc' from 'pandas.util._decorators' (C:\ProgramData\Anaconda3\lib\site-packages\pandas\util\_decorators.py)

I am trying to import pycaret but this error holds me back. How do I solve this?

ImportError

0 投票
2 回答
844 浏览

python - TypeError:PyCaret 回归中 -: 'str' 和 'int' 的不支持的操作数类型

我阅读了有关此主题的多个可用问题,但仍然不明白我的问题。

我正在尝试建立回归,使用PyCaret

我收到错误:

不确定问题出在哪里,因为我在结构中看不到任何字符串:

home并且first_time_pitcher是整数。

完整错误如下所示:

感谢任何提示!