Results for "vision-foundation-model"

Claude Code Claude Desktop GitHub Copilot Cursor Windsurf Cline Zed JetBrains

📄SKILL.md 🤖CLAUDE.md ⚡Claude Commands 📐.cursorrules 📐Cursor Rules 🕹️AGENTS.md 🧬codex.md 🏄.windsurfrules 🔧.clinerules 🧑‍✈️Copilot Instructions

All Development Operations Data Product Marketing Customer Design Sales

170 skills found · Page 1 of 6

roboflow / Notebooks

9.3k

A collection of tutorials on state-of-the-art computer vision models and techniques. Explore everything from foundational architectures like ResNet to cutting-edge models like RF-DETR, YOLO11, SAM 3, and Qwen3-VL.

universal

automatic-labeling-systemcomputer-visiondeep-learning+17

Updated 7h ago

joanrod / Star Vector

4.3k

StarVector is a foundation model for SVG generation that transforms vectorization into a code generation task. Using a vision-language modeling architecture, StarVector processes both visual and textual inputs to produce high-quality SVG code with remarkable precision.

universal

llmmultimodal-large-language-modelssvg+1

Updated 30m ago

VainF / Torch Pruning

3.3k

[CVPR 2023] DepGraph: Towards Any Structural Pruning; LLMs, Vision Foundation Models, etc.

universal

efficient-deep-learningllmmodel-compression+3

Updated 1h ago

mit-han-lab / Efficientvit

3.3k

Efficient vision foundation models for high-resolution generation and perception.

universal

deep-compression-autoencoderefficient-diffusion-modelefficientvit+5

Updated 6h ago

OpenGVLab / InternImage

2.8k

[CVPR 2023 Highlight] InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions

universal

backbonedeformable-convolutionfoundation-model+2

Updated 7h ago

baaivision / Painter

2.6k

Painter & SegGPT Series: Vision Foundation Models from BAAI

universal

cvpr2023generalist-modelgeneralist-painter+4

Updated 17h ago

ByteDance-Seed / Seed1.5 VL

1.6k

Seed1.5-VL, a vision-language foundation model designed to advance general-purpose multimodal understanding and reasoning, achieving state-of-the-art performance on 38 out of 60 public benchmarks.

universal

cookbooklarge-language-modelmultimodal-large-language-models+1

Updated 1d ago

uncbiag / Awesome Foundation Models

1.2k

A curated list of foundation models for vision and language tasks

universal

foundation-modelslarge-language-modelsmultimodal-models+2

Updated 4d ago

taokz / BiomedGPT

706

BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks

universal

Updated 1d ago

youquanl / Segment Any Point Cloud

636

[NeurIPS'23 Spotlight] Segment Any Point Cloud Sequences by Distilling Vision Foundation Models

universal

Updated 3d ago

rmaphoh / RETFound

618

Vision Foundation Models for Medical AI, including RETFound, DINOv2, DINOv3

universal

aidisease-detectioneye+2

Updated 6h ago

ChenDelong1999 / RemoteCLIP

531

🛰️ Official repository of paper "RemoteCLIP: A Vision Language Foundation Model for Remote Sensing" (IEEE TGRS)

universal

contrastive-language-image-pretrainingremote-sensingvision-language

Updated 7h ago

JindongGu / Awesome Prompting On Vision Language Model

508

This repo lists relevant papers summarized in our survey paper: A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models.

zed

foundation-modelsprompt-engineeringvision-and-language

Updated 1d ago

google-research / Maxvit

493

[ECCV 2022] Official repository for "MaxViT: Multi-Axis Vision Transformer". SOTA foundation models for classification, detection, segmentation, image quality, and generative modeling...

universal

architectureclassificationcnn+10

Updated 7d ago