我正在使用 MALLET 的主题建模。
我有一组关键字和一组文档的权重,我想训练这些文档并使用模型来推断新文档。
注意:文档的每个关键字都有分配给它的权重,类似于 tf-idf 分数。
根据我从文档中可以推断的内容,MALLET 的主题建模仅支持序列数据而不支持向量数据。
我想使用分配给文档每个关键字的权重进行分析。如果我不这样做,那么每个关键字都会被同等对待,因为我在分析时会丢失重要信息。
- 关于如何对我的数据使用 MALLET 主题建模的任何建议?
我正在使用 MALLET 的主题建模。
我有一组关键字和一组文档的权重,我想训练这些文档并使用模型来推断新文档。
注意:文档的每个关键字都有分配给它的权重,类似于 tf-idf 分数。
根据我从文档中可以推断的内容,MALLET 的主题建模仅支持序列数据而不支持向量数据。
我想使用分配给文档每个关键字的权重进行分析。如果我不这样做,那么每个关键字都会被同等对待,因为我在分析时会丢失重要信息。