SkillAgentSearch skills...

PPOxFamily

PPO x Family DRL Tutorial Course(决策智能入门级公开课:8节课帮你盘清算法理论,理顺代码逻辑,玩转决策AI应用实践 )

Install / Use

/learn @opendilab/PPOxFamily
About this skill

Quality Score

0/100

Supported Platforms

Universal

README

<div align="center"> <a href="https://github.com/opendilab/PPOxFamily"><img width="500px" height="auto" src="https://github.com/opendilab/PPOxFamily/blob/main/assets/ppof_logo.png"></a> </div>

PPO x Family 决策智能入门公开课

欢迎来到 PPO x Family 系列决策智能入门公开课。该系列将深入理解深度强化学习算法 PPO ,灵活运用一个 PPO 算法解决几乎所有常见的决策智能应用 ,帮助一切对于深度强化学习技术有好奇心的人,轻便且高效地制作应用原型,了解和学习最强大最易用的 PPO Family 。

P.S. 路过记得点个 star stars - ppof ,2022年12月起持续更新中~

News

课程大纲

<div align="center"> <a href="https://github.com/opendilab/PPOxFamily"><img width="1000px" height="auto" src="https://github.com/opendilab/PPOxFamily/blob/main/assets/outline.png"></a> </div>

内容导航

| 章节(视频课) | 算法理论资料 | 补充资料 | 习题 | 代码样例 | 应用样例| |------|-----|----------|-------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| ---| | 第一章:开启决策AI探索之旅 | 课程PPT <br> 课程文字稿 | 微课视频 <br> 策略梯度 <br> A2C <br> TRPO <br> 符号表 <br> QA总结 | 习题 <br> 习题题解 | PG算法示例 <br> A2C算法示例 <br> PPO算法示例 | 应用混剪 | | 第二章:解构复杂动作空间 | 课程PPT <br> 课程文字稿 | 重参数化 <br> PPO&DDPG <br> HyAR <br> QA总结 | 习题 <br> 习题题解 | 离散动作示例 <br> 连续动作示例 <br> 混合动作示例 <br> 应用训练代码 | 火箭回收等 | | 第三章:表征多模态动作空间 | 课程PPT <br> 课程文字稿 | 表征学习 <br> PPG <br> 不变性 <br> QA总结 | 习题 <br> 习题题解 | 编码方法示例 <br> Wrapper示例 <br> 计算图示例 <br>应用训练代码 | 软体机器人等 | | 第四章:解密稀疏奖励空间 | 课程PPT <br> 课程文字稿 | 逆强化学习 <br> 行为克隆BC <br> QA总结 | 习题 <br> 习题题解 | ICM好奇心奖励 <br> RND好奇心奖励 <br> Pop-Art示例 <br> 价值缩放 <br> [应用训练代码](https://github.com/opendilab/PPOxFamily/blob/main/chapter4_reward/chapter4_applicat

Related Skills

View on GitHub
GitHub Stars2.5k
CategoryEducation
Updated8h ago
Forks212

Languages

Python

Security Score

100/100

Audited on Mar 22, 2026

No findings