繁体 English 中英

q 代理正在学习不采取任何行动

[英]q agent is learning not to take any actions

原文 2020-05-24 15:23:45 4 1 python/ neural-network/ q-learning/ dqn

我正在训练一个深度 q 网络来交易股票； 它有两种可能的动作； 0：等待，1：没买就买，买了就卖。 作为输入，它获取所购买股票的价值、股票的当前价值以及与股票相关的前 5 个时间步长的股票价值。 所以像

[5.78, 5.93, -0.1, -0.2, -0.4, -0.5, -0.3]

奖励只是销售价格和购买价格之间的差额。 任何其他动作的奖励都是 0，尽管我尝试过让它为负数或其他没有结果的东西。

很简单，对吧？ 不幸的是，代理总是收敛于采取“0”行动。 即使我放大了以盈利或任何数量出售的回报。 我真的把头发拉出来了，有什么明显的我错过了吗？

1 个解决方案

尽管代理本身可能有问题，但我编写的第二个代理表现出类似的行为。 我终于通过降低学习率解决了这个问题； 最后它必须比原来低一千倍

增强智能体训练 Q Learning Taxi V3

[英]Enhancement of Agent Training Q Learning Taxi V3

Agent不断重复同一个动作圈，Q学习

[英]Agent repeats the same action circle non stop, Q learning

我应该如何使用 Q-learning 编写赌徒问题（没有任何强化学习包）？

[英]How should I code the Gambler's Problem with Q-learning (without any reinforcement learning packages)?

如何将Q学习应用于OpenAI-gym环境，在该环境中每个时间步均采取多项措施？

[英]How do apply Q-learning to an OpenAI-gym environment where multiple actions are taken at each time step?

强化学习 - 动作数量

[英]reinforcement learning - number of actions

Q-learning模型没有改进

[英]Q-learning model not improving

蛇游戏的深度Q学习

[英]Deep Q Learning For Snake Game

深度Q学习修改

[英]Deep Q-learning modification

Python Q-learning实现不起作用

[英]Python Q-learning implementation not working

Q-Learning Table 收敛到 -inf

[英]Q-Learning Table converges to -inf

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 增强智能体训练 Q Learning Taxi V3 Agent不断重复同一个动作圈，Q学习我应该如何使用 Q-learning 编写赌徒问题（没有任何强化学习包）？如何将Q学习应用于OpenAI-gym环境，在该环境中每个时间步均采取多项措施？强化学习 - 动作数量 Q-learning模型没有改进蛇游戏的深度Q学习深度Q学习修改 Python Q-learning实现不起作用 Q-Learning Table 收敛到 -inf

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM