"topic:visual-commonsense-reasoning" — Search

4 results for “topic:visual-commonsense-reasoning”

Recognition to Cognition Networks (code for the model in "From Recognition to Cognition: Visual Commonsense Reasoning", CVPR 2019)

Python46991Updated 4 years ago

commonsensereasoningvcrvisionvisualvisual-commonsense-reasoning

guyyariv/vLMIG

This repo contains the official PyTorch implementation of vLMIG: Improving Visual Commonsense in Language Models via Multiple Image Generation

Python170Updated 1 year ago

deep-learninglanguage-modelmultimodal-deep-learningvision-and-languagevisual-commonsensevisual-commonsense-reasoning

marialymperaiou/knowledge-enhanced-multimodal-learning

A list of research papers on knowledge-enhanced multimodal learning

80Updated 3 years ago

conditional-image-generationimage-text-matchingimage-text-retrievalknowledge-enhanced-multimodal-learningknowledge-enhanced-vision-languageknowledge-graphmulti-task-learningmultimodal-deep-learningmultimodal-retrievalstory-visualizationvision-and-languagevision-and-language-navigationvision-and-language-pre-trainingvision-language-transformervisual-commonsense-reasoningvisual-dialogvisual-groundingvisual-question-answeringvisual-reasoningvisual-storytelling

baohuyvanba/Vision-Zephyr

Vision-Zephyr: a multimodal LLM for Visual Commonsense Reasoning—CLIP-ViT + Zephyr-7B with visual prompting; code, training scripts, and VCR evaluation.

Python21Updated 6 months ago

clipcomputer-visionmultimodal-llmspythonpytorchtransformersvcrvision-languagevisual-commonsense-reasoningvisual-promptingzephyr