4

我想在 MeCab 中添加停用词——比如“我”、“你”或其他词。但我在 MeCab 的手册上找不到任何停用词的信息。

4

2 回答 2

0

MeCab 是一个词性标注器,它不做停用词删除。

您需要自己删除停用词,方法是处理输出并查看表面形式(文字标记)、基本形式(词形还原的规范形式)或词性。

于 2017-08-02T07:29:15.850 回答
0

我认为您不必在 MeCab 中添加停用词。您可以在 mecab 通过模式匹配(在 python 的情况下为 x.replace("stopword", "") )或使用 POS 标签(删除带有特定标签的术语)向您传递标记化数据后删除停用词。

于 2020-07-03T08:45:29.663 回答