python - 将连续映射到连续的强化学习方法

Question

我正在建立一个模型，公司必须设定价格并做出生产决策。价格是连续的，决策变量也是如此。（库存，上次销售，价格......）。

我可以使用什么强化学习方法将连续映射到连续？有哪些 python 包？如果没有 python 包，我可以编写一个包装器。

score 2 · Accepted Answer

PyBrain机器学习库正是您要找的。这是神经网络的相当复杂的实现，但是当你理解它时，你会得到一个非常强大的工具。

PyBrain 是一个用于神经网络建模的 Python 库。PyBrain 的概述应该让您了解一个基本概念：在每个时间戳，您为神经网络提供一组连续值并取出另一组连续值。但更重要的是，您可以评估输出并训练您的神经网络。

所有这些步骤——包括网络训练——已经在 PyBrain 中实现。

1 回答 1