资料详情

基于Python实现的人工智能作业小车问题课程论文+源码+演示视频

编号：2012


目录
1 任务描述	
2 环境配置	
3 算法设计	
3.1 离散版本��������������������������������� − ������	
（1）问题背景	
（2）Q-learning 算法	
（3）程序流程	
3.2 连续版本	
3.3 其他算法（选做）	
（1）SARSA	
（2）���������������(���)	
（3）DQN	
3.4 算法对比	
4 参数调整及优化1	
・回报 reward：	
5 总结与反思	
6 参考文献和资料	



1 任务描述
・必做：使用强化学习算法，解决MountainCar − v0；
使用强化学习算法，解决MountainCarContinous − v0












・选做：使用其他强化学习算法解决上述问题
2 环境配置
・ python(3.6) + gym(0.15.4) + tensorflow(1.2.1) + keras(2.2.4)























3 算法设计
3.1 离散版本��������������������������������� − ������
（1）问题背景
现有一小车在两座山峰之间的谷底，小车动力有限，无法直接登上右侧山峰，需要借助 动能和势能之间的转化才能到达目的地。在离散版本的MountainCar中，小车的行为（action） 是离散的，有向左、向右、静止三个选项，每个状态（state）下小车的观测值包含位置（position）和速度（velocity）两个方面，小车从-0.4―-0.6 之间的任意位置开始运动，在一个 episode
（200 步）内抵达 0.5 处即为成功，每走一步获得-1 的回报值。




Action


Push left


No push


Push right




Num


0


1


2








State


Max


Min




Position


0.6


−1.2




Velocity


0.07


−0.07