我正在使用 Mallet api 从 twitter 数据中提取主题,并且我已经提取了看起来不错的主题。但是我在估计 K 时遇到了问题。
例如,我将 K 值从 10 固定到 100。因此,我从数据中获取了不同数量的主题。但是,现在我想估计哪个 K 是最好的。有一些我知道的算法
- 困惑
- 经验可能性
- 边际似然(调和平均法)
- 轮廓
我找到了一个方法 model.estimate() 可以用来估计不同的 K 值。但我不知道 K 的值最适合模型。有没有人通过一些示例代码给出一些想法?谢谢。
我正在使用 Mallet api 从 twitter 数据中提取主题,并且我已经提取了看起来不错的主题。但是我在估计 K 时遇到了问题。
例如,我将 K 值从 10 固定到 100。因此,我从数据中获取了不同数量的主题。但是,现在我想估计哪个 K 是最好的。有一些我知道的算法
我找到了一个方法 model.estimate() 可以用来估计不同的 K 值。但我不知道 K 的值最适合模型。有没有人通过一些示例代码给出一些想法?谢谢。