Results for "opencompass"

Claude Code Claude Desktop GitHub Copilot Cursor Windsurf Cline Zed JetBrains

📄SKILL.md 🤖CLAUDE.md ⚡Claude Commands 📐.cursorrules 📐Cursor Rules 🕹️AGENTS.md 🧬codex.md 🏄.windsurfrules 🔧.clinerules 🧑‍✈️Copilot Instructions

All Development Operations Data Product Marketing Customer Design Sales

7 skills found

open-compass / Opencompass

6.8k

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

claude codeclaude desktop

benchmarkchatgptevaluation+5

Updated 1h ago

MigoXLab / Dingo

672

Dingo: A Comprehensive AI Data, Model and Application Quality Evaluation Tool

universal

agent-as-a-judgecommon-crawldata-agent+17

Updated 2h ago

SmartFlowAI / Llama3 Tutorial

511

Llama3-Tutorial（XTuner、LMDeploy、OpenCompass）

universal

Updated 5d ago

open-compass / CompassJudger

119

The All-in-one Judge Models introduced by Opencompass

universal

Updated 3d ago

AISBench / Benchmark

AISBench Benchmark is a model evaluation tool built on OpenCompass, compatible with OpenCompass’s configuration system, dataset structure, and model backend implementation, while extending support for service-based models.

universal

Updated 20h ago

domonic18 / AI Eval System

这是一个基于OpenCompass的模型评测系统，该系统提供了前端页面UI以方便用户自助开展评测工作。

universal

Updated 21d ago

little1d / Hands On OpenCompass

No description available

universal

Updated 10mo ago