首发于机器学习笔记写文章强化学习——从Q-Learning到DQN到底发生了什么?野风公众号:wildwind0112人赞同了该文章1学习目标1.复习Q-Learning;2.理解什么是值函数近似(FunctionApproximation);3.理解什么是DQN,弄清它和Q-Learning的区别是什么。2用Q-Learning解决经典迷宫问题现有一个5房间的房子,如图1所示,房间与房间之间通过门连接,编号0到4,5号是房子外边,即我们的终点。我们将agent随机放在任一房间内,每打开一个房门