2

我有一个 Aho Corasick trie,我通过它来解析一段文本。现在这个 trie 作为我的烧瓶应用程序的一部分存在。它部署在 Heroku 上,目前我天真地存储了自动机的腌制形式,在需要时将其取消腌制并使用它。有什么更好的方法可以有效地为这样的网络应用程序存储 Aho Corasick 自动机?

4

1 回答 1

2

访问磁盘上的 trie 并不完全是微不足道的,因此将其加载到内存中是一种好方法。

试试 pyahocorasick 库 FWIW。http://pyahocorasick.readthedocs.io/是你的朋友。它腌制自动机并使用紧凑的内存方案来限制内存使用

于 2017-11-22T13:24:17.377 回答