Results for "token-pruning"

Claude Code Claude Desktop GitHub Copilot Cursor Windsurf Cline Zed JetBrains

📄SKILL.md 🤖CLAUDE.md ⚡Claude Commands 📐.cursorrules 📐Cursor Rules 🕹️AGENTS.md 🧬codex.md 🏄.windsurfrules 🔧.clinerules 🧑‍✈️Copilot Instructions

All Development Operations Data Product Marketing Customer Design Sales

65 skills found · Page 1 of 3

Opencode-DCP / Opencode Dynamic Context Pruning

1.7k

Dynamic context pruning plugin for OpenCode - intelligently manages conversation context to optimize token usage

universal

Updated 45m ago

ModelTC / LightCompress

695

[EMNLP 2024 & AAAI 2026] A powerful toolkit for compressing large models including LLMs, VLMs, and video generative models.

universal

awqbenchmarkdeepseek-v3+15

Updated 38m ago

ZLKong / Awesome Collection Token Reduction

368

A collection of token reduction (token pruning, merging, clustering, etc.) techniques for ML/AI

universal

Updated 1d ago

xuyang-liu16 / Awesome Token Level Model Compression

194

📚 Collection of token-level model compression resources.

universal

computer-visionefficient-deep-learningmodel-acceleration+4

Updated 1d ago

mit-han-lab / Spatten

128

[HPCA'21] SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning

universal

attentionhardware-accelerationllm-inference+2

Updated 9d ago

Theia-4869 / FasterVLM

110

Official code for paper: [CLS] Attention is All You Need for Training-Free Visual Token Pruning: Make VLM Inference Faster.

universal

inference-efficiencytraining-free-accelerationvision-language-model+1

Updated 1d ago

OpenGVLab / DiffRate

103

[ICCV 23]An approach to enhance the efficiency of Vision Transformer (ViT) by concurrently employing token pruning and token merging techniques, while incorporating a differentiable compression rate.

universal

Updated 1d ago

kssteven418 / LTP

[KDD'22] Learned Token Pruning for Transformers

universal

bertefficient-modelefficient-neural-networks+4

Updated 7d ago

Theia-4869 / CDPruner

[NeurIPS 2025] Official code for paper: Beyond Attention or Similarity: Maximizing Conditional Diversity for Token Pruning in MLLMs.

universal

inference-efficiencytraining-free-accelerationvision-language-model+1

Updated just now

HVision-NKU / GlimpsePrune

Official repository of the paper "A Glimpse to Compress: Dynamic Visual Token Pruning for Large Vision-Language Models"

universal

inference-efficiencylvlmsmllms+2

Updated 22d ago

microsoft / Moonlit

This is a collection of our research on efficient AI, covering hardware-aware NAS and model compression.

universal

inference-efficiencymodel-compressionneural-architecture-search+1

Updated 1d ago

Theia-4869 / VisPruner

[ICCV 2025] Official code for paper: Beyond Text-Visual Attention: Exploiting Visual Cues for Effective Token Pruning in VLMs

universal

inference-efficiencytraining-free-accelerationvision-language-model+1

Updated just now

vbdi / Divprune

[CVPR 2025] DivPrune: Diversity-based Visual Token Pruning for Large Multimodal Models

universal

inference-optimizationllavallm+5

Updated 15d ago

cokeshao / HoliTom

[NeurIPS 2025] HoliTom: Holistic Token Merging for Fast Video Large Language Models

universal

large-language-modelsllavallava-next-video+5

Updated 15h ago

Visual-AI / PruneVid

[ACL 2025] PruneVid: Visual Token Pruning for Efficient Video Large Language Models

universal

Updated 1d ago

orailix / PACT

[CVPR 2025] PACT: Pruning and Clustering-Based Token Reduction for Faster Visual Language Models

universal

positional-bias-migitation-in-pruningtoken-clusteringtoken-merging+4

Updated 20d ago

LaVi-Lab / AIM

[ICCV 2025] Official code for "AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning"

universal

Updated 2d ago

mlvlab / Vid TLDR

Official implementation of CVPR 2024 paper "vid-TLDR: Training Free Token merging for Light-weight Video Transformer".

universal

computer-visioncvpr2024efficient-vision-transformers+3

Updated 1mo ago

Danielement321 / HiPrune

Implementation for HiPrune, a training-free visual token pruning method for VLM acceleration.

universal

Updated 8d ago

double125 / MADTP

MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for Accelerating Vision-Language Transformer

universal

Updated 11d ago