"topic:vqa-dataset" — Search

45 results for “topic:vqa-dataset”

A resource list and performance benchmark for blind video quality assessment (BVQA) models on user-generated content (UGC) datasets. [IEEE TIP'2021] "UGC-VQA: Benchmarking Blind Video Quality Assessment for User Generated Content", Zhengzhong Tu, Yilin Wang, Neil Birkbeck, Balu Adsumilli, Alan C. Bovik

Python12615Updated 3 years ago

bvqa-benchmarkbvqa-modelsimage-quality-assessmentperformance-benchmarkpicture-qualityugc-datasetsugc-vqavideo-quality-assessmentvqa-datasetyoutube-dataset

abachaa/VQA-Med-2019

Visual Question Answering in the Medical Domain VQA-Med 2019

9423Updated 2 years ago

imageclefmedical-imagingnlpradiologyvqavqa-datasetvqa-med

chakravarthi589/Video-Question-Answering_Resources

Video Question Answering | Video QA | VQA

9111Updated 3 months ago

aaaiacmarxiv-paperscvpreccviccvieeeneuripsvideo-queryvideo-question-answeringvideo-question-answering-datasetvideo-questionsvqavqa-datasetwacv

Cloud-CV/VQA

CloudCV Visual Question Answering Demo

Lua6724Updated 3 years ago

artificial-intelligencemachine-learningvqavqa-dataset

sutdcv/SUTD-TrafficQA

[CVPR2021] SUTD-TrafficQA: A Question Answering Benchmark and an Efficient Network for Video Reasoning over Traffic Events

JavaScript663Updated 1 month ago

annotationscvprcvpr2021datasetmultimodalmultimodal-deep-learningpapertraffic-eventsvideo-qavideo-reasoningvqavqa-dataset

CAMMA-public/SSG-VQA

[IPCAI'24 Best Paper] Advancing Surgical VQA with Scene Graph Knowledge

Python471Updated 9 months ago

scene-graphsurgical-data-sciencevqa-dataset

findalexli/SciGraphQA

SciGraphQA: Large-Scale Synthetic Multi-Turn Question-Answering Dataset for Scientific Graphs

Jupyter Notebook432Updated 1 year ago

datasetsllmsynthetic-datavision-languagevision-transformervqavqa-dataset

fraction-ai/GAP

Gamified Adversarial Prompting (GAP): Crowdsourcing AI-weakness-targeting data through gamification. Boost model performance with community-driven, strategic data collection

Python342Updated 1 year ago

aiartificial-intelligencecomputer-visionllmvisual-instruction-tuningvqavqa-datasetweb3

vzhou842/easy-VQA

The Easy Visual Question Answering dataset.

Python3412Updated 2 years ago

dataseteasy-vqavisual-question-answeringvqavqa-dataset

Letian2003/C-VQA

Counterfactual Reasoning VQA Dataset

Python282Updated 2 years ago

benchmarkcounterfactualdatasetllmreasoningsymbolicvqavqa-dataset

badripatro/awesome-vqg

Visual Question Generation reading list

284Updated 5 years ago

aclacl2018coling-2018cvpr2018domain-adaptationemnlpemnlp2017emnlp2018naaclquestion-answeringquestions-and-answersquestions-generationvisual-question-answeringvisual-questions-generationvisualizationvqavqa-datasetvqg

csebuetnlp/IllusionVQA

This repository contains the data and code of the paper titled "IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models"

Jupyter Notebook242Updated 10 months ago

optical-illusionsvisual-language-modelsvqavqa-dataset

abachaa/VQA-Med-2021

VQA-Med 2021

Python223Updated 3 years ago

medical-imagingradiologyvisual-question-answeringvisual-question-generationvqavqa-datasetvqa-med

yanx27/CLEVR3D

CLEVR3D Dataset: Comprehensive Visual Question Answering on Point Clouds through Compositional Scene Manipulation

Python201Updated 2 years ago

point-cloudscene-graphscene-understandingvqa-3dvqa-dataset

abdur75648/MedicalGPT

Medical Report Generation And VQA (Adapting XrayGPT to Any Modality)

Python146Updated 8 months ago

chatgptchatgpt4ollamallmllmsmedical-datasetmedical-imagingmedical-report-generationmedicalgptminigpt4multimodal-llmvicunavqavqa-datasetxraygpt

yousefkotp/Visual-Question-Answering

A Light weight deep learning model with with a web application to answer image-based questions with a non-generative approach for the VizWiz grand challenge 2023 by carefully curating the answer vocabulary and adding linear layer on top of Open AI's CLIP model as image and text encoder

Jupyter Notebook147Updated 2 years ago

clipclip-modeldeep-learningimage-and-textimage-encodingmachine-learningopen-ai-cliptext-encodingvisual-question-answeringvisual-question-anwseringvizwizvizwiz-vqavqavqa-2023vqa-dataset

google-research-datasets/mavericsArchived

MAVERICS (Manually-vAlidated Vq^2a Examples fRom Image-Caption datasetS) is a suite of test-only benchmarks for visual question answering (VQA).

130Updated 3 years ago

data-creationevaluationmavericsmultimodalvq2avqavqa-dataset

VLR-CVC/DocVQA2026

Official evaluation scripts and baseline prompts for the DocVQA 2026 (ICDAR 2026) Competition on Multimodal Reasoning over Documents.

Python121Updated 3 days ago

competitiondocument-understandingmultimodal-datasetsvqa-dataset

badripatro/MDN-VQG

No description provided.