0

我最近发现了 Textacy,当我浏览 API 参考指南时,我遇到了 Vectorizer 的错误。如果我从 API 参考中添加任何选项,我会得到一个 TypeError: unexpected keyword 参数。除了权重之外,我还收到其他选项的此错误。

我使用 pip 安装了 textacy,我在 Ubuntu 上使用 Python3。任何帮助表示赞赏。谢谢!

vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')

TypeError: __init__() got an unexpected keyword argument 'weighting'
4

1 回答 1

2

遇到同样的问题。API 文档不反映当前的 Vectorizer 关键字参数。Vectorizer 现在提供了不同的关键字参数,以允许更多地控制如何应用 TF*IDF。

vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')

tf_type应用标准词频 (TF),apply_idf=True应用逆文档频率 (IDF)。从 repo 评论中,idf_type='smooth'为每个文档频率添加一个,以避免零分裂。

要查看有关选项的更多信息,请查看此处存储库中第 182 行的评论:https ://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py

于 2018-03-29T19:09:16.707 回答