为了语言学习应用程序的目的,我正在使用 Stanza 从多种语言的文档中获取标记、引理和标签。这意味着我需要为不同的语言存储和加载许多 Stanza(默认)模型。
我现在的主要问题是,如果我想加载所有这些模型,内存需求对我的资源来说太多了。我目前在 AWS 上部署了一个运行 Stanza NLP 的 Web API。我希望将我的基础设施成本保持在最低水平。
一种可能的解决方案是在我需要运行脚本时一次加载一个模型。我想这意味着每次将模型加载到内存中都会有一些额外的开销。
我尝试的另一件事是使用我真正需要的处理器,这减少了内存占用,但没有那么多。
我尝试在 Github 和 Google 上查看开放和封闭的问题,但没有找到太多。
还有哪些其他可能的解决方案?