爱可可-爱生活 2019-10-08 12:48:01 发布的技术动态

英语轻松读发新版了，欢迎下载、更新

爱可可-爱生活
2019-10-08 12:48:01 发布
【主流PG(策略梯度)算法手把手教程(A2C/PPO/DDPG/TD3/SAC/DDPGfD)】’Policy Gradient is all you need! A step-by-step tutorial for well-known PG methods.' by Kyunghwan Kim GitHub: 网页链接

原文链接