Results for "visual-commonsense-reasoning"

Claude Code Claude Desktop GitHub Copilot Cursor Windsurf Cline Zed JetBrains

📄SKILL.md 🤖CLAUDE.md ⚡Claude Commands 📐.cursorrules 📐Cursor Rules 🕹️AGENTS.md 🧬codex.md 🏄.windsurfrules 🔧.clinerules 🧑‍✈️Copilot Instructions

All Development Operations Data Product Marketing Customer Design Sales

16 skills found

YehLi / Xmodaler

970

X-modaler is a versatile and high-performance codebase for cross-modal analytics(e.g., image captioning, video captioning, vision-language pre-training, visual question answering, visual commonsense reasoning, and cross-modal retrieval).

universal

cross-modal-retrievalimage-captioningpretraining+4

Updated 20d ago

jokieleung / Awesome Visual Question Answering

672

A curated list of Visual Question Answering(VQA)(Image/Video Question Answering),Visual Question Generation ,Visual Dialog ,Visual Commonsense Reasoning and related area.

universal

attention-networksawesome-listmulti-modal+2

Updated 19d ago

rowanz / R2c

469

Recognition to Cognition Networks (code for the model in "From Recognition to Cognition: Visual Commonsense Reasoning", CVPR 2019)

universal

commonsensereasoningvcr+3

Updated 1mo ago

yuweijiang / HGL Pytorch

Code for the model "Heterogeneous Graph Learning for Visual Commonsense Reasoning (NeurlPS 2019)"

universal

Updated 1y ago

WadeYin9712 / GD VCR

Code and data for "Broaden the Vision: Geo-Diverse Visual Commonsense Reasoning" (EMNLP 2021).

universal

Updated 8mo ago

guyyariv / VLMIG

This repo contains the official PyTorch implementation of vLMIG: Improving Visual Commonsense in Language Models via Multiple Image Generation

universal

deep-learninglanguage-modelmultimodal-deep-learning+3

Updated 5mo ago

AmingWu / CCN

Connective Cognition Network for Directional Visual Commonsense Reasoning

universal

Updated 5y ago

PKU-ICST-MIPL / CKRM TCSVT2020

Source code of our TCSVT 2020 paper "Multi-level Knowledge Injecting for Visual Commonsense Reasoning"

universal

Updated 4mo ago

zhangxi1997 / MCC

The code for MM2021 paper "Multi-Level Counterfactual Contrast for Visual Commonsense Reasoning"

universal

Updated 9mo ago

yekeren / VCR Shortcut Effects Study

Code and data of our AAAI2021 paper "A Case Study of the Shortcut Effects in Visual Commonsense Reasoning"

universal

Updated 3y ago

Gary-code / PEIFG

[ACM MM 2024] The released code of paper "Learning to Correction: Explainable Feedback Generation for Visual Commonsense Reasoning Distractor"

universal

Updated 9mo ago

marialymperaiou / Knowledge Enhanced Multimodal Learning

A list of research papers on knowledge-enhanced multimodal learning

universal

conditional-image-generationimage-text-matchingimage-text-retrieval+17

Updated 3mo ago

ZhuYun97 / Awesome Visual Reasoning Datasets

A curated collection of datasets for visual reasoning research across multiple domains, including mathematics, science, spatial understanding, and commonsense reasoning.

universal

Updated 2mo ago

SDLZY / ARC

The codes for paper "Two Processes in One Step: Jointly Answering and Explaining for Visual Commonsense Reasoning"

universal

Updated 6mo ago

zhangxi1997 / ECMR VCR

The coder for the paper "Explicit Cross-Modal Representation Learning for Visual Commonsense Reasoning"

universal

Updated 2y ago

eric-ai-lab / ViCor

This is the implementation of ACL 2024 Findings paper ViCor: Bridging Visual Understanding and Commonsense Reasoning with Large Language Models

universal

Updated 9mo ago