“pycaret”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

338 浏览

python - 使用 FastAPI 为使用 pycaret 生成的分类模型构建 API

我使用 pycaret 作为我的 ML 工作流程，我尝试使用 FastAPI 创建一个 API。这是我第一次进入生产级别，所以我对 API 有点困惑

我有 10 个特征；年龄：float，live_province：str，live_city：str，live_area_big：str，live_area_small：str，sex：float，marital：float，bank：str，salary：float，amount：float和一个标签，其中包含二进制值（0和 1)。

这就是我构建 API 的脚本

当我尝试运行uvicorn script:app并转到文档时，我找不到我的功能的参数，参数只显示模型和 input_dict

如何将我的功能带到 API 中的参数上？

2020-08-31T14:58:58.333

0 投票

1 回答

600 浏览

python - 尝试将 model.pickle 加载到 API 但引发 ```AttributeError: 'Data' object has no attribute 'columns'```

我已经使用 pycaret 构建了一个分类模型，并且已经生成了 pickle 文件。然后，我尝试构建一个 API 并使用 fastapi 加载 pickle 文件。

api 运行完美，但事情是当我尝试测试 api 并根据它返回的功能为其提供输入时：

！fastapi 文档的输出

我认为问题在于我将泡菜加载到 API 中的方式。你们能给我建议加载泡菜的正确方法吗？

python api machine-learning fastapi pycaret

2020-09-13T13:12:14.863

0 投票

0 回答

141 浏览

pycaret - Pycaret 异常 Plot_model

我正在使用 Pycaret 中的异常模块。这是一个令人印象深刻的程序并且易于使用。

plot_model(knn, plot="umap", save=True)产生一个很好的 umap 图，见 pdf。此交互式绘图通过悬停标识x=0和y=1坐标。

我想将x=0和y=1作为主要数据来手动对组进行聚类。'assign' 中的 df 没有给出这个。只有一个值“分数”。

有没有办法识别x=0和y=1坐标以便我可以导出它们？

谢谢

pycaret

2020-09-15T15:23:52.277

0 投票

1 回答

455 浏览

pycaret - PyCaret predict_model() 方法失败并出现 Pipeline not Found 错误

我已经在本地训练了我的 pycaret 模型，然后我把它推到了 S3。现在我想在我更大的生产数据集上运行 predict_model() 方法。

使用 boto3，我将模型 pickle 文件从 S3 复制到 Spark EMR 集群的主节点。然后我使用导入库

from pycaret.classification import *

并尝试应用我的预测如下 -

当我运行predict_model()它时出错说Pipeline not found

或者，当我在本地机器上运行相同的代码时，它工作正常。如何解决此错误？

pycaret

2020-09-18T03:43:57.233

0 投票

3 回答

6270 浏览

python - 在 Jupyter 中导入 PyCaret 时找不到模块

我正在尝试学习 PyCaret，但在尝试将其导入 Jupyter Lab 时遇到问题。

我在 virtualenv 中工作并通过 pip 安装了 pycaret：

我可以通过以下方式确认其安装pip list：

笔记本的第一行是：

但这会导致：

我正在努力解决这个问题，但找不到其他有类似情况的人。我也尝试通过 python shell 导入，并且效果很好。

python jupyter jupyter-lab pycaret

2020-10-10T14:45:10.630

0 投票

1 回答

99 浏览

machine-learning - 在大型数据集上训练异常检测模型并选择正确的模型

我们正在尝试为应用程序日志构建异常检测模型。

预处理已经完成，我们已经构建了自己的 word2vec 模型，该模型在应用程序日志条目上进行了训练。

现在我们有一个 150 万行 * 100 列的训练数据

其中每一行是日志条目的向量化表示（每个向量的长度为 100，因此为 100 列）

问题是大多数异常检测算法（LOF、SOS、SOD、SVM）都没有针对这个数据量进行扩展。我们将训练规模减少到 500K，但这些算法仍然挂起。在 POC 样本数据上表现最好的 SVM，没有让 n_jobs 在多个内核上运行它的选项。

一些算法能够完成，例如隔离森林（具有低 n_estimators）、直方图和聚类。但是这些无法检测到我们故意放入训练数据的异常情况。

有人知道我们如何为大型数据集运行异常检测算法吗？

在标准异常检测技术中找不到批量训练的任何选项。我们应该研究一下神经网络（自动编码器）吗？

选择最佳模型：

鉴于这是无监督学习，我们选择模型的方法如下：

在日志条目训练数据中，插入小说中的条目（比如指环王）。此日志条目的向量表示将不同于日志条目的其余部分。

在各种异常检测算法上运行数据集时，查看哪些算法能够检测到小说中的条目（这是异常）。

当我们尝试在一个非常小的数据集（1000 个条目）上运行异常检测时，这种方法很有效，其中日志文件使用 google 提供的 word2vec 模型进行了矢量化。

这种方法合理吗？我们也对其他想法持开放态度。鉴于它是一种无监督学习算法，我们必须输入一个异常条目并查看哪个模型能够识别它。

投入的污染比例为 0.003

machine-learning scikit-learn svm anomaly-detection pycaret

2020-10-19T09:05:33.097

0 投票

1 回答

328 浏览

jupyter-notebook - PyCaret - 如何在 Spyder 中获得与 Jupyter Notebook 类似的输出

我正在 Spyder 中运行 PyCaret 的设置和比较功能。根据 PyCaret 文档，总是有一个网格作为输出结果。我意识到文档认为代码在 Jyputer Notebook 中运行是理所当然的。

我使用 Spyder 作为机器学习问题的 IDE，我看到运行上述函数后，没有输出结果。

是否有任何解决方法可以继续使用 Spyder？

jupyter-notebook spyder pycaret

2020-10-20T08:31:41.517

0 投票

1 回答

924 浏览

python - 有没有办法返回由 Pycaret 调整的超参数？

Pycaret 自动搜索最佳参数。例如，下面的代码会将 5 个自动调整的模型分配给“tuned_top5”。

然而，这对我来说还不够。我想知道超参数的确切名称和值。例如，如果此代码将 max_depth 调整为 9，我希望打印“max_depth=9”或类似的结果。

有没有办法做到这一点？

python machine-learning hyperparameters pycaret

2020-11-13T11:27:39.227

0 投票

1 回答

1253 浏览

python - ImportError: cannot import name 'doc' from 'pandas.util._decorators' (C:\ProgramData\Anaconda3\lib\site-packages\pandas\util\_decorators.py)

I am trying to import pycaret but this error holds me back. How do I solve this?

ImportError

python pandas anaconda importerror pycaret

2020-11-16T00:09:35.837

0 投票

2 回答

844 浏览

python - TypeError：PyCaret 回归中 -: 'str' 和 'int' 的不支持的操作数类型

我阅读了有关此主题的多个可用问题，但仍然不明白我的问题。

我正在尝试建立回归，使用PyCaret：

我收到错误：

不确定问题出在哪里，因为我在结构中看不到任何字符串：

home并且first_time_pitcher是整数。

完整错误如下所示：

感谢任何提示！

python regression pycaret

2020-11-25T08:29:55.543

问题标签 [pycaret]

Reference