我正在使用 Rasa 中的 MITIE 后端训练一个用于识别短的、一到三个句子字符串的模型。该模型使用 spaCy 进行训练和工作,但它并不像我想要的那样准确。spaCy 的培训不超过五分钟,但 MITIE 的培训在我拥有 16GB RAM 的计算机上不间断地运行了几天。因此,我开始在具有 255GB RAM 和 32 个线程的 Amazon EC2 r4.8xlarge 实例上对其进行训练,但它似乎并未使用所有可用资源。
在 Rasa 配置文件中,我有num_threads: 32
和 set max_training_processes: 1
,我认为这将有助于使用所有可用的内存和计算能力。但现在它已经运行了几个小时,CPU 使用率处于 3%(100% 使用率,但仅在一个线程上),内存使用率保持在 25GB 左右,是可能的十分之一。
你们有没有尝试加速 MITIE 培训的经验?我的模型有 175 个意图和总共 6000 个意图示例。Rasa 配置文件中有什么需要调整的吗?