我已经使用 gensim.utils.simple_preprocess(str(sentence) 创建了一个我想用于主题建模的单词字典。但是,这也过滤了我真正需要的重要数字(房屋分辨率、账单号等)。我是如何克服这个问题的?可能是用他们的单词形式替换数字。不过,我该怎么做呢?
我已经使用 gensim.utils.simple_preprocess(str(sentence) 创建了一个我想用于主题建模的单词字典。但是,这也过滤了我真正需要的重要数字(房屋分辨率、账单号等)。我是如何克服这个问题的?可能是用他们的单词形式替换数字。不过,我该怎么做呢?