我正在建立一个模型,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是如此。(库存,上次销售,价格......)。
我可以使用什么强化学习方法将连续映射到连续?有哪些 python 包?如果没有 python 包,我可以编写一个包装器。
我正在建立一个模型,公司必须设定价格并做出生产决策。价格是连续的,决策变量也是如此。(库存,上次销售,价格......)。
我可以使用什么强化学习方法将连续映射到连续?有哪些 python 包?如果没有 python 包,我可以编写一个包装器。
PyBrain机器学习库正是您要找的。这是神经网络的相当复杂的实现,但是当你理解它时,你会得到一个非常强大的工具。
PyBrain 是一个用于神经网络建模的 Python 库。PyBrain 的概述应该让您了解一个基本概念:在每个时间戳,您为神经网络提供一组连续值并取出另一组连续值。但更重要的是,您可以评估输出并训练您的神经网络。
所有这些步骤——包括网络训练——已经在 PyBrain 中实现。