深入探讨离线强化学习 | PodLM - AI Podcast Generator

Sources

Skip to content Navigation Menu boyu-ai / Hands-on-RL Type / to search Code Issues 56 Pull requests Actions Projects Security Insights Files Go to file t LICENSE README.md rl_utils.py 第10章-Actor-Critic算法.ipynb 第11章-TRPO算法.ipynb 第12章-PPO算法.ipynb 第13章-DDPG算法.ipynb 第14章-SAC算法.ipynb 第15章-模仿学习.ipynb 第16章-模型预测控制.ipynb 第17章-基于模型的策略优化.ipynb 第18章-离线强化学习.ipynb 第19章-目标导向的强化学习.ipynb 第20章-多智能体强化学习入门.ipynb 第21章-多智能体强化学习进阶.ipynb 第2章-多臂老虎机问题.ipynb 第3章-马尔可夫决策过程.ipynb 第4章-动态规划算法.ipynb 第5章-时序差分算法.ipynb 第6章-Dyna-Q算法.ipynb 第7章-DQN算法.ipynb 第8章-DQN改进算法.ipynb 第9章-策略梯度算法.ipynb BreadcrumbsHands-on-RL /第18章-离线强化学习.ipynb Latest commit RockySJ RockySJ init 42585ca · 2 years ago History BreadcrumbsHands-on-RL /第18章-离线强化学习.ipynb File metadata and controls Preview Code Blame 674 lines (674 loc) · 113 KB Hands-on-RL/第18章-离线强化学习.ipynb at main · boyu-ai/Hands-on-RL Octotree qq20001224m (free user) 必须中文深入分析总结

Podcast Editor

Podcast.json

Preview

Audio

Title

Description

Topics