PytorchNetHub
项目注释+论文复现+算法竞赛+Pytorch实践+LeetCode+VLM预训练
Install / Use
/learn @bobo0810/PytorchNetHubREADME

目的
-
论文复现
-
算法竞赛
-
源码注释
paper得来终觉浅,绝知此事要coding。
工作
LearnLeetCode⭐️⭐️⭐️
八股基础:Transformer知识、位置编码等
手撕代码:梯度下降、SelfAttention、MultiHeadAttention等
刷题方法论:统一解题模板,简单清晰
轻量级图像识别框架Classification
支持任务: 1. 图像分类 2. 度量学习/特征对比
轻量级、模块化、高扩展、分布式、自动剪枝
Pytorch最小实践
自动混合精度AMP
分布式数据并行DDP
NCNN/MNN部署
TensorRT部署
视觉任务
目标检测:Faster rcnn、YOLO v1、YOLO v3、YOLO v4、SSD、CAM、S4ND
语义分割:U-Net
主干网络:FPN、SKNet、HS-ResNet、AFF-ResNet(并入官方库)、TargetDrop
激活函数:FunnelAct、DynamicReLU
知识蒸馏:RepDistiller
人脸相关
人脸检测:Yolov5-Face <u>主要贡献者</u>
人脸比对
分类器:AMSoftmax|ArcFace|Circle-Loss|DiscFace|NPCFace
训练策略:Semi-Siamese-Training|BroadFace
算法竞赛
雪浪制造AI挑战赛 排名: 32/2403
"计图"人工智能算法挑战赛-狗细分类 排名: 4/430
ACCV2022国际细粒度图像分析挑战赛-网络监督的细粒度识别 排名: 8/133
时间线
2025
| 自研 | 备注 | 更新 | | ---------------------------------------------------------- | ------------------------------- | ------ | | LearnLeetCode | 八股基础+手撕代码+刷题方法论⭐️⭐️⭐️ | 2025.1 | | MLLM-anything | 关于MLLM的训练、评测、最新进展<br>最新进展<br> 1. Omni最新进展<br> 2. VLM最新进展<br>训练<br> 1. Megatron大规模训练框架<br> 2. Energon大规模数据加载库<br>评测<br> 1. OpenCompass文本评测库<br> 2. VLMEvalKit多模评测库<br> 3. UltraEval-Audio音频评测库 | 2025.3 |
2024
| 自研 | 备注 | 更新 | | ------ | ----------------------------- | ------ | | 多模态大模型专栏 | 多模态VL系列之高质量数据(一)<br>多模态VL系列之模型架构(二)<br>多模态VL系列之训练策略(三)<br> | 2024.4 | | 24卡+公开数据+4B 可以有多强? | 勇闯OpenCompass榜单 | 2024.8 |
2023
| 自研 | 备注 | 更新 |
| ------------------------------------------------------------ | ------------------------------------------------------- | ------ |
| LearnColossalAI | ColossalAI教程 & 示例注释 & 学习笔记 (大模型高效训练) | 2023.3 |
| OpenMM | OpenMM系列最佳食用手册 | 2023.3 |
| LearnDeepSpeed | DeepSpeed教程 & 示例注释 & 学习笔记 (大模型高效训练) | 2023.8 |
| MiniGPT-4-DeepSpeed | MiniGPT-4基于DeepSpeed加速➕ 扩充模型规模 ➕ 实验分析 | 2023.9 |
2022
| 官方库 | | 更新 | | :------------------------------------------------------: | :-------------: | :----: | | RepVGG(CVPR 2021) | VGG再次伟大 解读+代码 | 2022.7 | | G-Ghost(IJCV 2022) | 探索各级别的特征冗余 解读+代码 | 2022.7 | | BBN(CVPR2020) | 双边分支网络,以解决长尾分布问题 解读+代码 | 2022.11 | | Vision Transformer(ICLR 2021) | Transformer首次应用到视觉领域 解读+代码 | 2022.12 | | MAE(CVPR2021) | 自监督学习 解读+代码 | 2022.12 |
| 自研 | 备注 | 更新 |
| ------------------------------------------------------------ | ------------------------------------ | ------- |
| bobotools | 工具库(已废弃,用GPT更顺手) | 2022.2 |
| Classification
| 图像识别框架 | 2022.2 |
| Pytorch最小实践
| Pytorch最小实践 | 2022.6 |
| BossVision | 简单、模块化、高扩展的分布式训练框架 | 2022.7 |
| CUDA-Python | Nvidia CUDA加速计算基础课程 | 2022.9 |
| DataHub | 公开数据集汇总 | 2022.11 |
2021
| 官方库 | 项目注释 | 备注 | 更新 | | :--------------------------------------------------------------: | :-------------------------------------------------------: | :--------------: | :----: | | SST(ECCV 2020) | 注释 | 浅层人脸学习 | 2021.2 | | RepDistiller | 注释 | 知识蒸馏算法合集 | 2021.2 |
| 自研 | 备注 | 更新 |
| :----------------------------------------------------------: | ----------------------------------------------- | ------- |
| JittorDogsClass | “计图”算法挑战赛-狗细分类 4/430 | 2021.4 |
| Yolov5-Face
| 人脸检测-支持纯TensorRT加速,成为主要贡献者 | 2021.12 |
2020
| 官方库 | 项目注释 | 备注 | 更新 | | :------------------------------------------------------------------: | :---------------------------------------------: | :----------: | :----: | | DynamicReLU(ECCV 2020) | 注释 | 动态激活函数 | 2020.9 | | AMSoftmax | 注释 | 乘法角间隔 | 2020.9 | | ArcFace(CVPR 2019) | 注释 | 加法角间隔 | 2020.9 | | CircleLoss(CVPR 2020) | 注释 | 加权角间隔 | 2020.9 |
| 自研 | 备注 | 更新 |
| :----------------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------: | ------- |
| FunnelRelu(ECCV 2020) | 新型激活函数-复现 | 2020.7 |
| AMP
| 自动混合精度-示例 | 2020.10 |
| BroadFace(ECCV 2020)
| 人脸对比队列更新策略-复现 | 2020.10 |
| TargetDrop
| 注意力机制Dropout-复现 | 2020.10 |
| HS-ResNet
| ResNet改进版-复现 | 2020.11 |
| AFF-ResNet(WACV 2021)
| 特征融合的统一方式- 复现,并入官方库 | 2020.11 |
| DDP
| 分布式数据并行-示例 | 2020.11 |
| DiscFace(ACCV 2020)
| 最小差异学习-复现 | 2020.12 |
| NPCFace
| 正负联合监督-复现 | 2020.12 |
2017-2019
| 官方库 | 项目注释 | 备注 | | :---------------------------------------------------------------------: | :------------------------------------------------------------------------------------------------------------------------------------: | :--------------: | | Fatser Rcnn(NIPS 2015) |
Related Skills
node-connect
340.2kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
84.1kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
340.2kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
commit-push-pr
84.1kCommit, push, and open a PR
