有没有办法获取 sklearn 的 TtfidfVectorizer 的 stopwords_ 属性(不是停用词)的 tf 和 idf?
它们已经被计算过了,所以模型应该有这些值,但是有没有人使用过它们?如果不是,我想我必须破解内部代码并自己获取它们,对吗?
[更新]
对于可能最终解决这个问题的任何人,作为更新,我最终做的是破解sklearn/feature_extraction/text.py
并将单词和值导出为类 CountVectorizer 的元组,而不仅仅是单词。
有没有办法获取 sklearn 的 TtfidfVectorizer 的 stopwords_ 属性(不是停用词)的 tf 和 idf?
它们已经被计算过了,所以模型应该有这些值,但是有没有人使用过它们?如果不是,我想我必须破解内部代码并自己获取它们,对吗?
[更新]
对于可能最终解决这个问题的任何人,作为更新,我最终做的是破解sklearn/feature_extraction/text.py
并将单词和值导出为类 CountVectorizer 的元组,而不仅仅是单词。