# Gym-实例 **Repository Path**: GZHzzz/gym-instance ## Basic Information - **Project Name**: Gym-实例 - **Description**: - 严谨地讲授强化学习的理论基础,主要定理均给出证明过程。各章内容循序渐进,覆盖了所有主流强化学习算法。 - 案例丰富:tensorflow、pytorch实现基于gym的强化学习算法 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 1 - **Created**: 2022-01-17 - **Last Updated**: 2024-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Gym-实例 #### 介绍 - 严谨地讲授强化学习的理论基础,主要定理均给出证明过程。各章内容循序渐进,覆盖了所有主流强化学习算法。 - 案例丰富:tensorflow、pytorch实现基于gym的强化学习算法 #### 使用说明 01. Introduction of Reinforcement Learning 02. Markov Decision Process 03. Model-based Numeric Iteration 04. Monte-Carlo Learning 05. Temporal Difference Learning 06. Function Approximation 07. Policy Gradient 08. Actor-Critic 09. Deterministic Policy Gradient 10. Case Study: Video Game 11. Case Study: Board Game 12. Case Study: Autonomous Driving #### 部分结果 ![输入图片说明](images/flappybird.jpg) ![输入图片说明](images%E5%85%B3%E8%8A%82%E8%87%82.jpg) ![输入图片说明](imageswalking.jpg) ![输入图片说明](imageslauncher.jpg) #### 常见问题 - 问:Windows系统下安装TensorFlow或PyTorch失败。答:请在Windows 10里安装Visual Studio 2019(如果有旧版本的Visual Studio请先彻底卸载)。更多细节和安装问题请自行Google。PyTorch安装可参阅:https://mp.weixin.qq.com/s/uRx1XOPrfFOdMlRU6I-eyA - 问:在Visual Studio或Visual Studio Code或PyCharm里面运行代码失败,比如找不到函数`display()`。答:本repo代码是配套Jupyter Notebook环境的,只能在Jupyter Notebook里运行。推荐您安装最新版本的Anaconda并直接运行下载来的Notebook。(`display()`函数是Jupyter Notebook里才有的函数。)不需要安装Visual Studio Code或PyCharm。更多细节或其他错误请自行Google。 - 问:GPU运行的结果和repo里带的结果不完全一样。答:本repo附带的结果都是用CPU跑的。GPU运算本来就不能精确复现。更多细节请自行Google。 - 问:GPU会比CPU跑的快么?答:没有用到TensorFlow和PyTorch的代码,不会用到GPU。用到TensorFlow和PyTorch的代码,由于网络一般不大,GPU反而可能更慢。PyTorch代码使用GPU时要把Tensor对象放在GPU上(可能需要修改代码)。 #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码