MiniChatGPT

Mini ChatGPT

Generate Convert Improve

Install / Use

/learn @hlp-ai/MiniChatGPT

About this skill

Quality Score

0/100

README

miniChatGPT

miniChatGPT基于Huggingface GPT2，支持有监督微调(SFT)、奖励模型(Reward Model)和PPO全流程ChatGPT训练。

如何使用

使用prepare_sft_dataset.py准备训练数据
使用train_sft.py进行有监督微调(SFT)
使用train_rm.py训练奖励模型(Reward Model)
基于奖励模型，使用train_ppo.py对SFT模型进行进一步PPO训练
运行main.py检查模型运行效果

致谢

本项目是对minChatGPT的修改和完善，感谢minChatGPT的辛勤工作。

Related Skills

node-connect

343.1k

Diagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps

frontend-design

90.0k

Create distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.

openai-whisper-api

343.1k

Transcribe audio via OpenAI Audio Transcriptions API (Whisper).

qqbot-media

343.1k

QQBot 富媒体收发能力。使用 <qqmedia> 标签，系统根据文件扩展名自动识别类型（图片/语音/视频/文件）。

hlp-ai

View profile

View on GitHub

GitHub Stars6

CategoryDevelopment

Updated2y ago

Forks1

hlp-ai/miniChatGPT

Languages

Python

Security Score

70/100

Audited on Mar 25, 2024

No findings