问题标签 [pycaret]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 FastAPI 为使用 pycaret 生成的分类模型构建 API
我使用 pycaret 作为我的 ML 工作流程,我尝试使用 FastAPI 创建一个 API。这是我第一次进入生产级别,所以我对 API 有点困惑
我有 10 个特征;年龄:float,live_province:str,live_city:str,live_area_big:str,live_area_small:str,sex:float,marital:float,bank:str,salary:float,amount:float和一个标签,其中包含二进制值(0和 1)。
这就是我构建 API 的脚本
当我尝试运行uvicorn script:app
并转到文档时,我找不到我的功能的参数,参数只显示模型和 input_dict
如何将我的功能带到 API 中的参数上?
pycaret - Pycaret 异常 Plot_model
我正在使用 Pycaret 中的异常模块。这是一个令人印象深刻的程序并且易于使用。
plot_model(knn, plot="umap", save=True)
产生一个很好的 umap 图,见 pdf。此交互式绘图通过悬停标识x=0和y=1坐标。
我想将x=0和y=1作为主要数据来手动对组进行聚类。'assign' 中的 df 没有给出这个。只有一个值“分数”。
有没有办法识别x=0和y=1坐标以便我可以导出它们?
谢谢
pycaret - PyCaret predict_model() 方法失败并出现 Pipeline not Found 错误
我已经在本地训练了我的 pycaret 模型,然后我把它推到了 S3。现在我想在我更大的生产数据集上运行 predict_model() 方法。
使用 boto3,我将模型 pickle 文件从 S3 复制到 Spark EMR 集群的主节点。然后我使用导入库
from pycaret.classification import *
并尝试应用我的预测如下 -
当我运行predict_model()
它时出错说Pipeline not found
或者,当我在本地机器上运行相同的代码时,它工作正常。如何解决此错误?
python - 在 Jupyter 中导入 PyCaret 时找不到模块
我正在尝试学习 PyCaret,但在尝试将其导入 Jupyter Lab 时遇到问题。
我在 virtualenv 中工作并通过 pip 安装了 pycaret:
我可以通过以下方式确认其安装pip list
:
笔记本的第一行是:
但这会导致:
我正在努力解决这个问题,但找不到其他有类似情况的人。我也尝试通过 python shell 导入,并且效果很好。
machine-learning - 在大型数据集上训练异常检测模型并选择正确的模型
我们正在尝试为应用程序日志构建异常检测模型。
预处理已经完成,我们已经构建了自己的 word2vec 模型,该模型在应用程序日志条目上进行了训练。
现在我们有一个 150 万行 * 100 列的训练数据
其中每一行是日志条目的向量化表示(每个向量的长度为 100,因此为 100 列)
问题是大多数异常检测算法(LOF、SOS、SOD、SVM)都没有针对这个数据量进行扩展。我们将训练规模减少到 500K,但这些算法仍然挂起。在 POC 样本数据上表现最好的 SVM,没有让 n_jobs 在多个内核上运行它的选项。
一些算法能够完成,例如隔离森林(具有低 n_estimators)、直方图和聚类。但是这些无法检测到我们故意放入训练数据的异常情况。
有人知道我们如何为大型数据集运行异常检测算法吗?
在标准异常检测技术中找不到批量训练的任何选项。我们应该研究一下神经网络(自动编码器)吗?
选择最佳模型:
鉴于这是无监督学习,我们选择模型的方法如下:
在日志条目训练数据中,插入小说中的条目(比如指环王)。此日志条目的向量表示将不同于日志条目的其余部分。
在各种异常检测算法上运行数据集时,查看哪些算法能够检测到小说中的条目(这是异常)。
当我们尝试在一个非常小的数据集(1000 个条目)上运行异常检测时,这种方法很有效,其中日志文件使用 google 提供的 word2vec 模型进行了矢量化。
这种方法合理吗?我们也对其他想法持开放态度。鉴于它是一种无监督学习算法,我们必须输入一个异常条目并查看哪个模型能够识别它。
投入的污染比例为 0.003
jupyter-notebook - PyCaret - 如何在 Spyder 中获得与 Jupyter Notebook 类似的输出
我正在 Spyder 中运行 PyCaret 的设置和比较功能。根据 PyCaret 文档,总是有一个网格作为输出结果。我意识到文档认为代码在 Jyputer Notebook 中运行是理所当然的。
我使用 Spyder 作为机器学习问题的 IDE,我看到运行上述函数后,没有输出结果。
是否有任何解决方法可以继续使用 Spyder?
python - 有没有办法返回由 Pycaret 调整的超参数?
Pycaret 自动搜索最佳参数。例如,下面的代码会将 5 个自动调整的模型分配给“tuned_top5”。
然而,这对我来说还不够。我想知道超参数的确切名称和值。例如,如果此代码将 max_depth 调整为 9,我希望打印“max_depth=9”或类似的结果。
有没有办法做到这一点?
python - ImportError: cannot import name 'doc' from 'pandas.util._decorators' (C:\ProgramData\Anaconda3\lib\site-packages\pandas\util\_decorators.py)
I am trying to import pycaret but this error holds me back. How do I solve this?