我正在解决公司文件的二进制文本分类问题。将长度为 100 的 Doc2Vec 嵌入与 LightGBM 一起使用会产生很好的效果。然而,对于这个项目,为至少一个组件近似一个主题含义将是非常有价值的。理想情况下,这将是一个被 LightGBM 列为高度重要的功能,并通过一些例子进行了轶事解释。
有没有人尝试过这个,或者对于这种复杂程度的高维模型,解释是否应该被排除在外?
我正在解决公司文件的二进制文本分类问题。将长度为 100 的 Doc2Vec 嵌入与 LightGBM 一起使用会产生很好的效果。然而,对于这个项目,为至少一个组件近似一个主题含义将是非常有价值的。理想情况下,这将是一个被 LightGBM 列为高度重要的功能,并通过一些例子进行了轶事解释。
有没有人尝试过这个,或者对于这种复杂程度的高维模型,解释是否应该被排除在外?