我正在使用 Mallet 进行主题建模。我的输入文本中的大量单词包括字母和数字;例如,A54、D892。我刚刚注意到 Mallet 会自动删除数字,只保留单词中的字母。导入文本文件时,我什至不使用 --remove-stopwords 选项。有谁知道我该如何解决这个问题。
问问题
133 次
我正在使用 Mallet 进行主题建模。我的输入文本中的大量单词包括字母和数字;例如,A54、D892。我刚刚注意到 Mallet 会自动删除数字,只保留单词中的字母。导入文本文件时,我什至不使用 --remove-stopwords 选项。有谁知道我该如何解决这个问题。