我正在使用 TextBlob for python 对推文进行一些情绪分析。TextBlob 中的默认分析器是 PatternAnalyzer,它工作得很好,而且速度很快。
sent = TextBlob(tweet.decode('utf-8')).sentiment
我现在尝试切换到 NaiveBayesAnalyzer,发现运行时不适合我的需求。(每条推文接近 5 秒。)
sent = TextBlob(tweet.decode('utf-8'), analyzer=NaiveBayesAnalyzer()).sentiment
我以前使用过朴素贝叶斯分类器的 scikit learn 实现,并没有发现它这么慢,所以我想知道在这种情况下我是否正确使用它。
我假设分析器是预训练的,至少文档说明“在电影评论数据集上训练的朴素贝叶斯分析器”。但它也有一个函数 train(),被描述为“在电影评论语料库上训练朴素贝叶斯分类器”。它是否在每次运行之前在内部训练分析器?我希望不是。
有谁知道加快速度的方法?