我尝试使用 Python 2.6 的 ahocorasick C 模块。我建了一个KeywordTree,然后用UTF-8插入一个中文单词,然后:
在 .py 文件中出现“分段错误”,否则它将耗尽内存。
在 iPython shell 中,它运行良好。
代码是:
tree = ahocorasick.KeywordTree()
tree.add('头条')
C 模块来自: https ://hkn.eecs.berkeley.edu/~dyoo/python/ahocorasick/ahocorasick-1.0pre.tar.gz
POST:该模块适用于 Python 2.7