SkillAgentSearch skills...

MiniChatGPT

Mini ChatGPT

Install / Use

/learn @hlp-ai/MiniChatGPT
About this skill

Quality Score

0/100

Supported Platforms

Universal

README

miniChatGPT

miniChatGPT基于Huggingface GPT2,支持有监督微调(SFT)、奖励模型(Reward Model)和PPO全流程ChatGPT训练。

如何使用

  1. 使用prepare_sft_dataset.py准备训练数据
  2. 使用train_sft.py进行有监督微调(SFT)
  3. 使用train_rm.py训练奖励模型(Reward Model)
  4. 基于奖励模型,使用train_ppo.py对SFT模型进行进一步PPO训练
  5. 运行main.py检查模型运行效果

致谢

本项目是对minChatGPT的修改和完善,感谢minChatGPT的辛勤工作。

Related Skills

View on GitHub
GitHub Stars6
CategoryDevelopment
Updated2y ago
Forks1

Languages

Python

Security Score

70/100

Audited on Mar 25, 2024

No findings