我正在尝试为我在 scikit learn 中构建的朴素贝叶斯模型构建自己的 pmml 导出器。在阅读 PMML 文档时,似乎对于每个特征向量,如果它是离散的,您可以根据计数数据输出模型,如果它是连续的,则可以输出为高斯/泊松分布。但是我的 scikit 学习模型的系数是根据特征的经验对数概率,即 p(y|x_i)。是否可以根据这些概率而不是计数来指定贝叶斯输入参数?
问问题
167 次
我正在尝试为我在 scikit learn 中构建的朴素贝叶斯模型构建自己的 pmml 导出器。在阅读 PMML 文档时,似乎对于每个特征向量,如果它是离散的,您可以根据计数数据输出模型,如果它是连续的,则可以输出为高斯/泊松分布。但是我的 scikit 学习模型的系数是根据特征的经验对数概率,即 p(y|x_i)。是否可以根据这些概率而不是计数来指定贝叶斯输入参数?