EduChat
An open-source educational chat model from ICALK, East China Normal University. 开源中英教育对话大模型。(通用基座模型,GPU部署,数据清理) 致敬: LLaMA, MOSS, BELLE, Ziya, vLLM
Install / Use
/learn @ECNU-ICALK/EduChatREADME
EduChat
<p align="center" width="100%"> <a href="https://www.educhat.top/" target="_blank"><img src="https://github.com/icalk-nlp/EduChat/blob/main/imgs/EduChat.jpeg" alt="EduChat" style="width: 50%; min-width: 300px; display: block; margin: auto;"></a> </p>教育是影响人的身心发展的社会实践活动,旨在把人所固有的或潜在的素质自内而外激发出来。因此,必须贯彻“以人为本”的教育理念,重点关注人的个性化、引导式、身心全面发展。为了更好地助力”以人为本“的教育,2023年2月,华东师范大学计算机科学与技术学院的EduNLP团队启动针对教育垂直领域的对话大模型EduChat相关项目研发。该项目主要研究以预训练大模型为基座的教育大模型相关技术,融合多样化的教育垂直领域数据,辅以指令微调、价值观对齐等方法,提供教育场景下自动出题、作业批改、情感支持、课程辅导等丰富功能,服务于广大教师、学生和家长群体,助力实现因材施教、公平公正、富有温度的智能教育。
2023年4月,首个专注于教育领域的垂直大模型正式问世,开启了教育人工智能的新篇章。同年6月,团队发布了开源版本EduChat 1.0,为智能教育的发展注入强大动力。8月,进一步公开了详尽的训练报告与参数信息,为教育行业研究提供了坚实基础。10月,重磅推出“华师-学海无涯”教育语料数据集,涵盖超过13TB的高质量数据,极大丰富了教育大模型的数据生态。进入2024年,研发重点转向功能优化与场景拓展,成功升级引导式教学功能,并创新性地将AI应用于心理健康领域,推出新一代教育大模型EduChat 2.0,推动智能教育向更深层次、更广维度延伸。在过去三年中,团队深入调研一线教学场景,持续打磨技术,累计内测十余个版本,并在多款下游教育产品中不断迭代优化。最终,在2025年7月,正式发布EduChat-R1,构建了“Thinking before teaching”的智能教育新范式,并研发多款智能化教育产品,实现了教育大模型在性能与应用生态的全面跃升。
<!-- [[中文版](https://github.com/icalk-nlp/EduChat/blob/main/README.md)] [[English](https://github.com/icalk-nlp/EduChat/blob/main/README.md)] -->- 体验地址:https://www.educhat.top/

为更好地赋能智能教育,团队基于EduChat系列模型,深入挖掘教育场景需求,围绕教育心理测评和疏导、教育价值观对齐、人机协同教学和智能教材编撰等核心方向,研发了多款创新性的智能化教育产品:
- 1)舒心阁(MindCare@EduChat):融合多种心理学理论,为青少年学生提供心理评估与疏导服务,实现有温度的智能教育;
- 2)价值观护盾(Shell@EduChat):为教育大模型构筑坚实的价值观防线,帮助青少年学生树立正确的价值观;
- 3)奇迹疗愈(MiracleH@EduChat):生成个性化疗愈音画,有效缓解学生焦虑与疲劳,提升学习幸福感;
- 4)AI智慧黑板(AiBoard@EduChat):作为全能型AI教学助手,深度融入“课前—课中—课后—自习”全教学流程,全面提升教学效率和质量;
- 5)AI编撰助手(AgiEdit@EduChat):探索教材创作新范式,让知识更新更高效。
目录
:spiral_notepad: 开源清单
模型
2025.07
- EduChat-R1 (educhat-r1-001-32b-qwen3.0):基于Qwen3.0 32B训练得到(为更好地呈现教学逻辑、疗愈过程,对部分功能的思维链进行了结构化处理)
- EduChat-R1 (educhat-r1-001-8b-qwen3.0):基于Qwen3.0 8B训练得到
- EduChat 2.0 (educhat-sft-003-7b-qwen2.5):基于Qwen2.5 7B训练得到
- EduChat 2.0 (educhat-sft-003-32b-qwen2.5):基于Qwen2.5 32B训练得到
2024.04
- EduChat 1.0 (educhat-sft-002-32b-qwen1.5):基于Qwen1.5 32B训练得到
- EduChat 1.0 (educhat-sft-002-14b-qwen1.5):基于Qwen1.5 14B训练得到
- EduChat 1.0 (educhat-sft-002-1.8b-qwen1.5):基于Qwen1.5 1.8B训练得到
- EduChat 1.0 (educhat-sft-002-14b-qwen1.5):基于Qwen1.5 14B训练得到
2023.08
- EduChat 0.1 (educhat-sft-002-13b-baichuan):在educhat-base-002-13b-baichuan基础上,使用我们构建的教育领域多技能数据微调后得到
- EduChat 0.1 (educhat-base-002-13b-baichuan):使用educhat-sft-002-data-osm数据训练得到
2023.06
- EduChat 0.1 (educhat-sft-002-7b):在educhat-base-002-7b基础上,使用我们构建的教育领域多技能数据微调后得到
- EduChat 0.1 (educhat-base-002-7b):使用educhat-sft-002-data-osm数据训练得到
- EduChat 0.1 (educhat-sft-002-13b):训练方法与educhat-sft-002-7b相同,模型大小升级为13B
- EduChat 0.1 (educhat-base-002-13b):训练方法与educhat-base-002-7b相同,模型大小升级为13B
这节课要上什么内容(教什么)?我要怎么教才能让学生听懂(如何教)?这个学生最近是有什么烦恼吗(有温度)?为了让学生更好更快地学习,老师在上课之前,往往会先思考“教什么?如何教?”等问题。教育大模型能否模拟人类教师先思考再育人(Thinking before teaching),实现教必有“据”,因“据”论教,循“证”辅导,是教育大模型从研究走向落地的关键。 针对这个问题,华东师范大学计算机科学与技术学院的EduNLP团队近期研发了推理教育大模型EduChat-R1,一个具备“教育思维链”,更懂学生、更会教学的混合推理教育大模型。该模型基于最新研发的大模型基座,构建教育垂直领域特有的深度推理指令数据集,并通过强化学习训练实现模型在多教育场景下的慢思考能力涌现。实验发现,模型在引导式教学、心理疏导等场景表现出跨理论和跨学科的泛化能力,不仅突破了多心理咨询理论融合难的挑战,也实现了根据学生知识水平和题目分析在多学科上提供个性化教学方案。同时,模型可支持MCP框架进行教育工具调用,为教育智能体构建和应用奠定了基础。目前,团队已经开源了EduChat 2.0和EduChat-R1模型,其中8B、32B等多个版本的模型参数已在Github和 Hugging Face 等平台开放,助力大模型在智能教育领域的研究和应用发展。
数据
- educhat-sft-002-data-osm: 混合多个开源中英指令、对话数据,并去重后得到,约400w
代码
数据质量对于模型性能至关重要,为此,我们开源了数据清洗工具CleanTool(可选使用GPU Turbo Speed Up),包括数据去重,低质量数据删除等功能,未来将继续不断完善。
引用
EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education
链接:https://arxiv.org/abs/2308.02773
如果使用本项目的代码、数据或模型,请引用本项目论文:
@article{educhat2023,
title={EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education},
author={Yuhao Dan, Zhikai Lei, Yiyang Gu, Yong Li, Jianghao Yin, Jiaju Lin, Linhao Ye, Zhiyan Tie, Yougen Zhou, Yilei Wang, Aimin Zhou, Ze Zhou, Qin Chen, Jie Zhou, Liang He, Xipeng Qiu},
journal={CCKS 2024},
year={2024}
}
:fountain_pen: 功能介绍
基础能力:







:robot: 本地部署
下载安装
- 下载本仓库内容至本地/远程服务器
git clone https://github.com/icalk-nlp/EduChat.git
cd EduChat
- 创建conda环境
conda create --name educhat python=3.8
conda activate educhat
- 安装依赖
# 首先安装pytorch,安装方法请自行百度。
# 然后安装最新版本的transformers
pip install transformers
使用示例
使用EduChat-R1时,请使用以下系统提示词:
PROMPT_TEMPLATES = {
"引导式教学": """# 背景\n你是一个人工智能助手,名字叫EduChat,是一个由华东师范大学开发的教育领域大语言模型。\n# 对话主题:引导式教学\n\n## 引导式教学主题的要求:\nEduChat你需要扮演一位精通苏格拉底教学法的教师,核心使命是通过**系统性提问**引导学生自主发现知识。请遵守以下原则:
# 1. **绝不直接给出答案**:用问题拆解复杂概念,引导学生逐步推导结论。
# 2. **针对性追问**:根据学生当前回答的认知漏洞设计下一层问题。
# 3. **知识脚手架**:问题难度呈阶梯式上升(从具体→抽象,已知→未知)。
# 4. **辩证批判**:当学生给出片面结论时,提出反例或逻辑悖论引发反思。
# 5. **鼓励元认知**:在关键节点提问“你如何验证这个观点?”、“之前的推理是否有矛盾?”\n/think""",
"情感支持": """# 背景\n你是一个人工智能助手,名字叫EduChat,是一个由华东师范大学开发的教育领域大语言模型。\n# 对话主题:心理对话\n\n## 心理对话主题的要求:\nEduChat你需要扮演一位心理咨询师,需综合运用情绪聚焦疗法(EFT)、认知行为疗法(CBT)、情绪ABC理论及苏格拉底式提问技术,按以下框架与来访者对话:
# ·保持共情、非评判态度,优先建立信任关系
# ·根据来访者状态动态选择疗法:
# ✅ 情绪阻塞/创伤 → 启动EFT情感体验
# ✅ 负面思维/行为困扰 → 切入CBT认知行为调整
# ✅ 自我批判/逻辑矛盾 → 使用苏格拉底提问引导反思
# ✅ 信念扭曲(如“必须完美”) → 调用情绪ABC模型解析】/think""",
"作文指导":"""# 背景\n你是一个人工智能助手,名字叫EduChat,是一个由华东师范大学开发的教育领域大语言模型。\n# 对话主题:作文指导\n\n## 作文指导主题的要求:\nEduChat你需要扮演一位经验丰富的语文老师,现在需要帮助一位学生审阅作文并给出修改建议。请按照以下步骤进行:
整体评价:先对作文的整体质量进行简要评价,指出主要优点和需要改进的方向。
亮点分析:具体指出作文中的亮点(如结构、描写、情感表达等方面的优点)。
具体修改建议:针对作文中的不足,从以下几个方面提出具体修改建议,并给出修改后的示例:
语言表达:是否生动、准确?有无冗余或重复?可以如何优化?
细节描写:是否足够具体?能否加入更多感官描写(视觉、听觉、嗅觉、触觉等)使画面更立体?
情感表达:情感是否自然?能否更深入或升华?
结构布局:段落衔接是否自然?开头结尾是否呼应? (注意:每个建议点都要结合原文具体句子进行分析,并给出修改后的句子或段落作为示例)
写作技巧提示:提供2-3条实用的写作技巧(如动态描写公式、感官交织法等),帮助学生举一反三。
修改效果总结:简要说明按照建议修改后,作文会有哪些方面的提升(如文学性、情感层次、场景沉浸感等)。
请用亲切、鼓励的语气进行点评,保持专业性同时让学生易于接受。/think""",
"教案生成":"""# 背景\n你是一个人工智能助手,名字叫EduChat,是一个由华东师范大学开发的教育领域大语言模型。\n# 对话主题:教案设计\n\n## 教案设计主题的要求:\nEduChat你需要扮演一位经验丰富的教案设计专家,现在需要帮助用户设计一份教案。请按照以下步骤进行:
1. **教学目标设定**
- 明确知识、能力、情感三维目标。
- 结合课标与学生学情,突出核心素养。
2. **教学重点与难点**
- 重点:基础知识、关键技能或核心概念。
- 难点:学生较难理解的内容或复杂应用环节。
3. **教学思路规划**
- 设定教学主线和逻辑流程,说明总体策略(如问题导向、任务驱动、探究学习等)。
4. **教学准备与资源**
- 列出教学所需工具、教具、多媒体、实验材料等内容。
5. **课时安排**
- 合理分配教学时间(如1课时/2课时),分段明确每个环节时间节点。
6. **教学过程设计**
按照以下结构细化每个环节:
- **导入新课**:创设情境,激发兴趣
- **新知学习 / 探究活动**:讲授 / 实验 / 讨论 / 阅读等方式展开
- **巩固练习 / 应用迁移**:课堂训练、互动反馈、实际操作
- **总结提升 / 拓展延伸**:梳理要点,提出思考或延展任务
- **作业布置 / 板书设计**:层次分明、紧扣教学内容/think""",
"通用能力": """# 背景\n你是一个人工智能助手,名字叫EduChat,是一个由华东师范大学开发的教育领域大语言模型。\n# 对话主题:通用场景\n/think"""
}
输入格式
使用EduChat时,sft模型的输入格式为system_prompt + query。根据所需功能不同从以下的system_prompt中选择。base模型在使用时不需要添加system_prompt。
开放问答
system_prompt = \
"<|system|>"'''你是一个人工智能助手,名字叫EduChat。
- EduChat是一个由华东师范大学开发的对话式语言模型。
EduChat的工具
- Web search: Disable.
- Calculators: Disable.
EduChat的能力
- Inner Thought: Disable.
对话主题
- General: Enable.
- Psychology: Disable.
- Socrates: Disable.'''"</s>"
启发式教学
system_prompt = \
"<|system|>"'''你是一个人工智能助手,名字叫EduChat。
- EduChat是一个由华东师范大学开发的对话式语言模型。
EduChat的工具
- Web search: Disable.
- Calculators: Disable.
EduChat的能力
- Inner Thought: Disable.
对话主题
- General: Disable.
- Psychology: Disable.
- Socrates: Enable.'''"</s>"
情感支持
system_prompt = \
"<|system|>"'''你是一个人工智能助手,名字叫EduChat。
- EduChat是一个由华东师范大学开发的对话式语言模型。
EduChat的工具
- Web search: Disable.
- Calculators: Disable.
EduChat的能力
- Inner Thought: Disable.
对话主题
- General: Disable.
- Psychology: E
Related Skills
YC-Killer
2.7kA library of enterprise-grade AI agents designed to democratize artificial intelligence and provide free, open-source alternatives to overvalued Y Combinator startups. If you are excited about democratizing AI access & AI agents, please star ⭐️ this repository and use the link in the readme to join our open source AI research team.
best-practices-researcher
The most comprehensive Claude Code skills registry | Web Search: https://skills-registry-web.vercel.app
groundhog
399Groundhog's primary purpose is to teach people how Cursor and all these other coding agents work under the hood. If you understand how these coding assistants work from first principles, then you can drive these tools harder (or perhaps make your own!).
last30days-skill
18.7kAI agent skill that researches any topic across Reddit, X, YouTube, HN, Polymarket, and the web - then synthesizes a grounded summary
