DouyuBarrage
(2020年最新)斗鱼弹幕抓取及实时弹幕数据可视化,分为crawler(弹幕抓取),server(弹幕统计数据服务器),web(统计数据可视化前端)三部分
Install / Use
/learn @Crawler995/DouyuBarrageREADME
DouyuBarrage
(2020/03/02更)此项目已停止维护,因为……第二版要发布啦!
斗鱼弹幕抓取及可视化管理平台第二版DouyuBarrage-Pro,提供弹幕抓取、抓取记录查询、弹幕下载、自定义关键词统计、铁粉统计、高光时刻自动捕获、弹幕实时发送速度可视化、高频弹幕词云等功能(正在开发中,即将发布,打造企业级应用的使用体验!)
斗鱼弹幕抓取及实时弹幕数据可视化,分为crawler(弹幕抓取),server(弹幕统计数据服务器),web(统计数据可视化前端)三部分。
正在开发中……

运行
安装依赖
# dybarrage-crawler
pip install -r requirements.txt
# dybarrage-server
mvn clean install
# dybarrage-web
npm install
准备
- 确保本地mysql数据库处于可用状态,使用
set global time_zone="+8:00"设置正确的时区 - 打开dybarrage-crawler中的
config.py文件,修改其中的mysql连接设置 - 打开dybarrage-server中的
application.properties文件,修改其中的crawler.path为dybarrage-crawler的绝对路径
运行
# dybarrage-server
mvn spring-boot:run
# dybarrage-web
npm start
然后打开浏览器,访问localhost:3000?roomid=[斗鱼房间号]即可,如localhost:3000?roomid=12306。
不需要管dybarrage-crawler模块,其将会由dybarrage-server启动。
相关技术
-
dybarrage-crawlerPython 3.7, Mysql
-
dybarrage-serverJava 8, Spring Boot, Mybatis
-
dybarrage-webJavaScript, React, Ant Design, Echarts
架构

先随便画一个,有一说一,要说清楚这个系统有丶难,我得去复习软件工程了。
前后端接口
注:baseURL = /api/room/{roomId}
| 接口 | 描述 | | :------------ | :----------------------------- | | /roombaseinfo | 获取房间基本信息 | | /sysbaseinfo | 获取系统基本信息 | | /chartdata | 获取图表相关数据 | | /barragedata | 获取弹幕信息 | | /crawl | 心跳请求,保持弹幕抓取进程运行 |
一些闲聊
- 自己运行了几天,主要分析了C皇和电棍的直播间,发现棍孝子确实只会刷屏,平均一个人发了5、6条弹幕,有一个头号棍孝子一个人发了800多条弹幕;C皇观众比较均匀,平均一个人发了2条弹幕,最多的一个人也只发了40多条。
Related Skills
node-connect
344.1kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
96.8kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
344.1kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
344.1kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
