formula2X 公式识别系统

项目介绍

随着学术论文的数字化和在线共享的增加，数学公式作为学术内容的重要组成部分，其规范化复制和引用成为了一个重要问题。传统的图片、PDF等格式公式难以直接编辑和引用，这大大增加了研究工作的难度。基于对这一点的体会，我们设计了formula2X公式识别系统，旨在提供一个从数学公式图片到可编辑文本格式的自动化转换工具。项目采用Django框架，基于深度学习模型，实现了Web端的公式识别。用户可将包含公式的图片上传至Web端，formula2X可实现图片中公式的识别，并将识别结果分别以Markdown、LaTeX等格式可复制呈现。

项目结构

test.py：测试模型的最小程序 testforweb.py：查看Django安装情况的测试脚本 backend：项目主体 BackEnd\BackEnd：核心配置文件 BackEnd\BackEnd\urls.py：根路由配置 BackEnd\BackEnd\settings.py：项目设置（模板路径、语言、时区、内网访问权限等） BackEnd\BackEnd\views.py：核心业务逻辑函数 BackEnd\processSection文件夹：初始版本核心功能模块 依赖根路由配置：path('processSection/', include('processSection.urls')) BackEnd\templates：前端代码

BackEnd\static文件夹：CSS等静态资源

BackEnd\templates\main.html：首页及文件上传接口 BackEnd\templates\resDisplay.html：识别结果展示页 BackEnd\uploadedFile文件夹：用户上传图片存储目录 db.sqlite3：项目自带数据库

如何使用

以下操作推荐在项目工作空间(.venv)中进行：

基础使用

安装依赖 pip install -r requirements.txt
启动服务 cd Backend python manage.py runserver 0.0.0.0:8000 o 本机访问：http://127.0.0.1:8000/ o 局域网访问：<服务器IP地址>:8000
注意事项 o 首次运行时需等待模型权重文件自动下载（命令行显示进度条） o 虚拟环境部署需先激活环境再启动服务 o 关闭服务：在Backend目录下按 Ctrl+C

模型训练

环境准备

安装训练依赖

pip install "pix2tex[train]"

数据准备

生成数据集 python -m pix2tex.dataset.dataset --equations <数学公式文本路径> --images <训练集图片文件夹路径> --out <输出文件名.pkl> o 预生成数据集：Google Drive下载（含formulae.zip图片和math.txt标签） o 验证集/测试集需重复此步骤

配置训练

修改配置文件

o 编辑 pix2tex/model/settings/config.yaml o 关键配置项： data: <训练集.pkl路径> # 如 dataset_train.pkl valdata: <验证集.pkl路径> # 如 dataset_val.pkl tokenizer: <分词器路径> # 默认 tokenizer.json num_tokens: <词汇表大小> # 需与分词器一致

启动训练

python -m pix2tex.train --config <配置文件路径> 推荐调整参数： • batch_size • learning_rate • warmup_steps • max_epochs 自定义分词器（可选） python -m pix2tex.dataset.dataset --equations <数学公式文本路径> --vocab-size <词汇表大小> # 推荐 8000 --out <输出分词器.json> # 如 custom_tokenizer.json 完成后需同步更新配置文件中的 tokenizer 路径和 num_tokens 值。

注意事项

定期检查数据加载逻辑
建议使用GPU环境（显存消耗较大）
参考官方Colab Notebook进行云端训练

训练结束后模型文件的保存与替换

模型文件的保存

在模型训练完成后，模型文件将以 .pth 格式保存，文件命名格式如下： {name}_e{epoch}_step{step}.pth 其中： {name} 为模型的名称，来自于 config.yaml 配置中的 args.name {epoch} 为当前训练的轮次（e+1） {step} 为当前训练步骤编号（i） 模型默认保存在： out_path = os.path.join(args.model_path, args.name) 此外，训练时的配置文件也会自动保存： config.yaml 该文件包含所有训练参数，便于后续加载或复现训练过程。

如何替换预训练模型

训练完成后，您需要手动替换 formula2X 识别系统中的模型文件： 找到最新的模型文件 ls <模型保存目录> 例如： formula2X_e10_step500.pth 将训练好的模型文件复制到 Web 端目录 cp <新模型路径> <Web 端模型存储路径> 例如： cp formula2X_e10_step500.pth backend/model.pth 修改 Web 端代码以加载新模型 在 settings.py 或 views.py 中修改模型加载路径： MODEL_PATH = "backend/model.pth" 重启 Web 服务 cd Backend python manage.py runserver 0.0.0.0:8000

版本说明

V 0.0.1 Beta | 2025年1月27日 完成开源全部流程

V 1.0.0 Beta | 2025年10月31日

重构前端布局逻辑重新面世

Formula2X

Install / Use

README