[英]Building a deep reinforcement learning with a cnn q - approximation
我是 DRL 的新手。 从这个代码https://github.com/jaromiru/cwcf 开始,我想用CNN代替用于q函数近似的MLP,但我不知道该怎么做。 有谁能够帮助我? 谢谢
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.