2

我目前正在尝试记录和绘制各种主题数值的连贯性分数,以确定最适合我的语料库的主题数量。在使用 u_mass 进行几次试验后,数据被证明是不确定的,因为分数不会在特定主题编号附近保持平稳。我知道使用 u_mass 时 CV 的范围是 -14 到 14,但是我的值范围是 -2 到 -1,并且无法选择准确的主题编号。由于这些问题,我尝试使用 c_v 而不是 u_mass 但收到以下错误:

    An attempt has been made to start a new process before the
    current process has finished its bootstrapping phase.

    This probably means that you are not using fork to start your
    child processes and you have forgotten to use the proper idiom
    in the main module:

这是我计算相干值的代码

cm = CoherenceModel(model=ldamodel, texts=texts, dictionary=dictionary,coherence='c_v')
      print("THIS IS THE COHERENCE VALUE ")
      coherence = cm.get_coherence()
      print(coherence)

如果有人可以帮助解决我的 c_v 或 u_mass 问题,将不胜感激!谢谢!

4

0 回答 0