从 CatBoost 的论文和文档中,我可以理解它如何在训练集上对分类变量进行编码。但是分类变量如何在测试集中编码是一个谜。我在他们的 GitHub 上看到了一些与此相关的问题,但同样不够详细,无法理解和实施。我认为目标平均编码是在训练集上完成的,并且测试集中的级别被替换为这些值。但这不是合法信息,我需要对此进行详细回答。任何人都知道编码是如何在测试集中进行的?
从 CatBoost 的论文和文档中,我可以理解它如何在训练集上对分类变量进行编码。但是分类变量如何在测试集中编码是一个谜。我在他们的 GitHub 上看到了一些与此相关的问题,但同样不够详细,无法理解和实施。我认为目标平均编码是在训练集上完成的,并且测试集中的级别被替换为这些值。但这不是合法信息,我需要对此进行详细回答。任何人都知道编码是如何在测试集中进行的?