PaddleRec
Recommendation Algorithm大规模推荐算法库,包含推荐系统经典及最新算法LR、Wide&Deep、DSSM、TDM、MIND、Word2Vec、Bert4Rec、DeepWalk、SSR、AITM,DSIN,SIGN,IPREC、GRU4Rec、Youtube_dnn、NCF、GNN、FM、FFM、DeepFM、DCN、DIN、DIEN、DLRM、MMOE、PLE、ESMM、ESCMM, MAML、xDeepFM、DeepFEFM、NFM、AFM、RALM、DMR、GateNet、NAML、DIFM、Deep Crossing、PNN、BST、AutoInt、FGCNN、FLEN、Fibinet、ListWise、DeepRec、ENSFM,TiSAS,AutoFIS等,包含经典推荐系统数据集criteo 、movielens等
Install / Use
/learn @PaddlePaddle/PaddleRecREADME
- [2022/6/15] 重磅福利:短视频推荐场景下的多任务学习应用实战视频直播课,欢迎扫码关注:<p align="center"><img width="200" height="200" margin="500" src="./doc/imgs/aistudio_micro_video.png"/></p>
- [2022/6/15] 新增3个前沿算法:ESCM2,MetaHeac,KIM
- [2022/5/18] 新增3个前沿算法:AITM,SIGN,DSIN, IPRec
- [2022/3/21] 新增paper目录,发布我们对21年的推荐顶会论文的分析,以及工业界的推荐论文列表,供大家参考。
- [2022/3/10] 新增5个前沿算法: DCN_V2, MHCN, FLEN, Dselect_K, AutoFIS。
- [2022/1/12] 新增AI Studio一键在线运行功能,可以方便快捷的在AI Studio平台上在线体验我们的模型。
-
推荐系统是在互联网信息爆炸式增长的时代背景下,帮助用户高效获得感兴趣信息的关键;
-
推荐系统也是帮助产品最大限度吸引用户、留存用户、增加用户粘性、提高用户转化率的银弹。
-
有无数优秀的产品依靠用户可感知的推荐系统建立了良好的口碑,也有无数的公司依靠直击用户痛点的推荐系统在行业中占领了一席之地。
可以说,谁能掌握和利用好推荐系统,谁就能在信息分发的激烈竞争中抢得先机。 但与此同时,有着许多问题困扰着推荐系统的开发者,比如:庞大的数据量,复杂的模型结构,低效的分布式训练环境,波动的在离线一致性,苛刻的上线部署要求,以上种种,不胜枚举。
- 源于飞桨生态的搜索推荐模型 一站式开箱即用工具
- 适合初学者,开发者,研究者的推荐系统全流程解决方案
- 包含内容理解、匹配、召回、排序、 多任务、重排序等多个任务的完整推荐搜索算法库。支持模型列表
在线运行
环境要求
-
Python 2.7.15 / 3.5 / 3.6 / 3.7, 推荐使用python3.7,示例中的python默认表示python3.7
-
PaddlePaddle >=2.0
-
操作系统: Windows/Mac/Linux
Windows下PaddleRec目前仅支持单机训练,分布式训练建议使用Linux环境
安装Paddle
- gpu环境pip安装
python -m pip install paddlepaddle-gpu==2.0.0 - cpu环境pip安装
python -m pip install paddlepaddle # gcc8
更多版本下载可参考paddle官网下载安装
下载PaddleRec
注意:官方维护github版本地址:
https://github.com/PaddlePaddle/PaddleRec
git clone https://github.com/PaddlePaddle/PaddleRec/
cd PaddleRec
快速运行
我们以排序模型中的dnn模型为例介绍PaddleRec的一键启动。训练数据来源为Criteo数据集,我们从中截取了100条数据:
python -u tools/trainer.py -m models/rank/dnn/config.yaml # 动态图训练
python -u tools/static_trainer.py -m models/rank/dnn/config.yaml # 静态图训练
<h2 align="center">帮助文档</h2>
项目背景
入门教程
进阶教程
FAQ
致谢
支持模型列表
<h2 align="center">支持模型列表</h2>| 方向 | 模型 | 在线环境 | 分布式CPU | 分布式GPU | 支持版本| 论文 | |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------:| :-----------------------------------------------------------------------: | :-----: | :-------: | :-------: |:-------: | :---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | 内容理解 | TextCnn(文档) | Python CPU/GPU | ✓ | x | >=2.1.0 | [EMNLP 2014]Convolutional neural networks for sentence classication | | 内容理解 | TagSpace(文档) | Python CPU/GPU | ✓ | x | >=2.1.0 | [EMNLP 2014]TagSpace: Semantic Embeddings from Hashtags | | 匹配 | DSSM(文档) | Python CPU/GPU | ✓ | x | >=2.1.0 | [CIKM 2013]Learning Deep Structured Semantic Models for Web Search using Clickthrough Data | | 匹配 | Match-Pyramid(文档) | Python CPU/GPU | ✓ | x | >=2.1.0 | [AAAI 2016]Text Matching as Image Recognition | | 匹配 | MultiView-Simnet(文档) | Python CPU/GPU | ✓ | x | >=2.1.0 | [WWW 2015]A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems | | 匹配 | KIM(文档) | - | x | x | >=2.1.0 | [SIGIR 2021]Personalized News Recommendation with Knowledge-aware Interactive Matching | | 召回 | TDM | - | ✓ | >=1.8.0 | 1.8.5 | [KDD 2018]Learning Tree-based Deep Model for Recommender Systems | | 召回 | FastText | - | x | x | 1.8.5 | [EACL 2017]Bag of Tricks for Efficient Text Classification | | 召回 | MIND(文档) | Python CPU/GPU | x | x | >=2.1.0 | [2019]Multi-Interest Network with Dynamic Routing for Recommendation at Tmall | | 召回 | Word2Vec(文档) | Python CPU/GPU | ✓ | x | >=2.1.0 | [NIPS 2013]Distributed Representations of Words and Phrases and their Compositionality | | 召回 | DeepWalk(文档) | Python CPU/GPU | x | x | >=2.1.0 | [SIGKDD 2014]DeepWalk: Online Learning of Social Representations | | 召回 | SSR | - |
