用在Pycaret的预处理函数setup()中请告诉我推荐的参数。
取决于输入数据的类型 如何参数 我应该改变它吗?
例如,通过分类、回归、聚类,我应该改变参数吗?还是会在不同的基础上改变?
谢谢你。
在 Pycaret 设置中有几个选项,如何预处理你的数据。已经定义了几个默认选项。例如,分类变量的一种热编码,normalise=True
默认情况下使用“zscore”来规范化数据等。
没有适当的默认方法来预处理您的数据,因为所有数据集都是独一无二的,并且每个数据集都需要单独受到威胁。从 EDA 中您可以了解,您需要以哪种方式预处理数据或简单的跟踪错误实验也可能有所帮助(至少可以建立基线)。对于某些算法,有一些考虑。
以下是解释分类任务的设置:https ://pycaret.readthedocs.io/en/latest/api/classification.htm l