我有一堆构成环境和代理的 Java 代码。我想使用其中一个 Python 强化学习库(stable-baselines、tf-agents、rllib 等)来训练 Java 代理/环境的策略。然后在 Java 端部署策略进行生产。是否有将其他语言合并到 Python RL 库中的标准做法?我正在考虑以下解决方案之一:
- 将 Java env/agent 代码包装到 REST API 中,并在 Python 中实现自定义环境,调用该 API 以逐步通过环境。
- 使用 Py4j 从 Python 调用 Java 并实现自定义环境。
哪一个会更好?还有其他方法吗?
编辑:我最终选择了前者——部署了一个封装环境的 Web 服务器。对我来说效果很好。如果有更好的做法来处理这种情况,请留下问题!