问题标签 [mdp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1202 浏览

c++ - 以编程方式分析故障转储

是否有任何 api 可以加载故障转储、符号存储中的符号,然后允许以编程方式访问信息?

我想创建一个工具来自动处理故障转储并根据它们生成报告。

0 投票
1 回答
194 浏览

spring - 如何知道 Spring MDP Listener 是否处于活动状态?

我有一个 Spring MDP 监听器部署为一个监听 JMS 队列并回复同步请求-回复消息的战争。监视听众是否还活着的最佳方法是什么?或者更多地考虑如何为 Web 应用程序设置监视器以检查它是否已在 Java 应用程序服务器中启动并运行?

0 投票
2 回答
1260 浏览

jms - JMS中基于定义时间的消息调度/消费

我们使用 IBM WebSphere MQ 作为带有 Spring MDP(消息驱动 POJO)的 JMS 提供者。

JMS 中是否有任何方法可以在消息中配置与时间相关的属性,以便只能在特定定义的时间使用消息?

例如,如果我将三个消息发送到队列 M1、M2 和 M3。在哪里,我可以配置 M2 消息属性,比如说凌晨 3 点。而消费者方面,消费者只能在凌晨 3 点选择这条消息。如果未定义时间,则应以 JMS Receiver 的方式使用消息。

0 投票
2 回答
369 浏览

reinforcement-learning - 没有后继状态的强化学习

我试图提出一个问题作为强化学习问题。我的困难是代理所处的状态是随机变化的。他们必须简单地在他们所处的状态中选择一个动作。我想根据他们因执行动作而获得的奖励来学习所有状态的适当动作。

问题:

这是特定类型的 RL 问题吗?如果没有后继状态,那么如何计算状态的价值?

0 投票
0 回答
385 浏览

spring - Spring MDP 不消费消息

我正在实现 Spring MDP + JMSTemplate 来发送和接收消息。消息发送机制工作正常,但是没有调用 MDP。我尝试测试通过普通接收器,并且能够检索消息,但不能通过 MDP。可能是什么问题呢?我可以看到消息在请求队列中累积,但不知何故 MDP 没有被触发。我是否在配置中遗漏了任何内容或需要注意其他事项?

这是 Spring 配置。发送和接收的 Java 类几乎是标准的。

0 投票
1 回答
1378 浏览

spring - 如何配置 Spring 消息侦听器 (MDP) 以在集群中拥有一个实例

我有一个配置为弹簧消息侦听器

这是在具有 2 个节点的集群上运行的。我看到它为每个节点创建了 1 个消费者,而不是每个集群创建了 1 个消费者。它们都配置了上述 xml,因此它们具有相同的 clientId。然而,当 2 个通知发布到队列时,两个侦听器都在运行,每个侦听器都收到一个通知,并且都并行执行。这是一个问题,因为通知需要按顺序处理。

我似乎不知道如何使它每个集群而不是每个节点只有一个消息侦听器。

0 投票
1 回答
3192 浏览

spring - 将 WebLogic MDB 转换为 Spring 消息驱动的 POJO

我有一个使用 MDB 在 WebLogic 11b (10.3.4) 上构建的应用程序。我正在尝试将这些转换为 Spring MDP。这是有问题的MDB:

MDB 的父级 TraxMessageRouter 实现 MessageListener 接口。

我在 jms-applicationContext.xml 中创建了 MDP bean:

如何将 @MessageDriven 注释转换为正确的 Spring 语法?我现在可以评论出来吗?

我还有几个 EventRouterBean。他们是否都在 jms-ApplicationContext.xml 中获得了 bean 声明,或者我可以将父级 TraxMessageRouter 添加到 xml 中吗?

需要对配置文件进行哪些其他更改?是否有关于如何从 MDB 过渡到 MDP 的良好指南?是否有关于如何从 EJB 3 过渡到 Spring 的良好指南?

0 投票
1 回答
2249 浏览

mdp - 何时使用策略迭代而不是值迭代

我目前正在研究马尔可夫决策过程的动态编程解决方案。我觉得我已经很好地掌握了 VI 和 PI,而且我很清楚 PI 的动机(当我们需要正确的政策时,集中在正确的州公用事业上似乎是不必要的工作)。然而,我的实验都没有显示 PI 在运行时方面是有利的。无论状态空间的大小和折扣因子如何,它似乎总是需要更长的时间。

这可能是由于实现(我正在使用BURLAP库),或者我的实验不佳。然而,即使是趋势似乎也没有显示出好处。需要注意的是,PI 的 BURLAP 实现实际上是“修改后的策略迭代”,它在每次迭代时运行有限的 VI 变体。我的问题是,您是否知道(修改后的)PI 应该优于 VI 的任何情况,无论是理论上的还是实际的?

0 投票
3 回答
4658 浏览

spring - Spring消息监听器/手动确认

我知道这听起来像听到了 1000 次,但我不这么认为,我真的找不到解决方案:

使用常见的 ejb,我可以使用确认模式手动确认()消息。如果我不这样做,它会重新交付。我过去这样做过,效果很好。

使用 Spring JMS 我有一个问题,似乎我要么可以将重新传递设置为仅在抛出异常或根本不抛出异常时才进行处理。

如何像使用ejb一样实现它?

我的问题是:如果消息被确认,我不希望它被重新传递,即使发生异常。

0 投票
1 回答
869 浏览

python - PyBrains Q-Learning 迷宫示例。国家价值观和全球政策

我正在尝试 PyBrains 迷宫示例

我的设置是:

现在,我对我得到的结果没有信心 在此处输入图像描述

右下角 (1, 8) 为吸收状态

我在 mdp.py 中添加了额外的惩罚状态 (1, 7):

现在,我不明白,经过 1000 次运行和每次运行期间的 200 次交互后,代理如何认为我的惩罚状态是好的状态(您可以看到正方形是白色的)

我想看看最终运行后每个州和政策的价值。我怎么做?我发现这一行table.params.reshape(81,4).max(1).reshape(9,9)返回了一些值,但我不确定这些值是否对应于值函数的值