有没有办法对 R 中的评论数据框进行主题建模和分类?
我有 10 列评论(其中每条评论都是与问题相关的主题的开放式句子),我想按每列评论的主题对每条评论进行分类。
我尝试使用 R 中的 topicmodels 包使用 LDA(潜在狄利克雷分配)(并在应用 LDA 模型之前使用 DocumentTermMatrix 和语料库)。我试图使用最低的困惑度找到最佳的主题数量。
问题是我不知道评论的每个句子都归类于什么主题。它确实将单词放入类似的主题,但不是按句子。所以有点混乱。
我不知道从那里去哪里,需要关于如何做到这一点的建议。
我能够使用 Sentimenter 包在 R 中的同一数据帧上应用 Sentimental Analysis,它有效,但我不能对主题建模和分类做同样的事情。
如何在 R 中为一列中的每个评论句子执行此操作(总共 10 列)?