"topic:audio-visual" — Search

84 results for “topic:audio-visual”

krantiparida/awesome-audio-visual

A curated list of different papers and datasets in various areas of audio-visual processing

76766Updated 1 week ago

audio-visualawesomeawesome-listcross-modallocalizationmutli-modalsource-separation

TaoRuijie/TalkNet-ASD

ACM MM 2021: 'Is Someone Speaking? Exploring Long-term Temporal Features for Audio-visual Active Speaker Detection'

Python454100Updated 2 days ago

active-speaker-detectionaudio-visualawesome-asdmultimedia

HumanAIGC/omnitalker

[NeurIPS 2025] OmniTalker: Real-Time Text-Driven Talking Head Generation with In-Context Audio-Visual Style Replication

JavaScript41929Updated 6 days ago

audio-visualdiffusion-transformerreal-timetalking-head

samhirtarif/react-audio-visualize

An audio visualizer for React. Provides separate components to visualize both live audio and audio blobs.

TypeScript18035Updated 1 week ago

audioaudio-visualaudio-visualizationaudio-visualizeraudio-waveformaudio-waveforms-visualization

heypoom/patchies

Patchies is a creative coding patcher for audio, visual and computational things that runs on the web. Connect tools you know and try new ones ✨

TypeScript1475Updated 1 day ago

algoraveartassemblyassembly-languageaudio-visualcreative-codingdesignglslhydrajavascriptlive-codingp5jsrustsoundstrudelsveltetypescriptuxnuxntalxyflow

guyyariv/TempoTokens

This repo contains the official PyTorch implementation of: Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation

Python12815Updated 5 days ago

ai-artaudio-to-videoaudio-visualdeep-learningdiffusion-modelsgenerative-aimodelscopepytorchvideo-synthesis

jerosoler/waveform-path

🎙 Generator waveform paths for SVG 🎶

JavaScript1277Updated 1 week ago

audioaudio-playeraudio-visualaudio-visualizermusicpathsvgwaveformwebaudio

V-

v-iashin/Synchformer

Source code for "Synchformer: Efficient Synchronization from Sparse Cues" (ICASSP 2024)

Python1129Updated 6 days ago

audio-visualcontrastive-learningmulti-modalsynchronizationvideo-understanding

ekazakos/temporal-binding-network

Implementation of "EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition, ICCV, 2019" in PyTorch

Python11224Updated 3 months ago

action-recognitionaudio-visualconvolutional-networksegocentricfusion

ankurbhatia24/MULTIMODAL-EMOTION-RECOGNITION

Human Emotion Understanding using multimodal dataset.

Jupyter Notebook11026Updated 3 weeks ago

audio-visualaudio-visual-speech-recognitionaudio-visualizationdeep-learningdeeplearningkeraslibrosamachine-learningmultimodal-emotion-recognitionopensmilepythontensorflow

Libvisual/libvisual

Libvisual Audio Visualization

C10033Updated 1 month ago

alsaaudio-libraryaudio-visualaudio-visualizationaudio-visualizerccxxlibrarylibvisualmusic-visualizationmusic-visualizeropenglportaudiopulseaudiosdlspectrum-analyserspectrum-analysisspectrum-analyzervisualization

V-

v-iashin/SparseSync

Source code for "Sparse in Space and Time: Audio-visual Synchronisation with Trainable Selectors." (Spotlight at the BMVC 2022)

Python5410Updated 1 month ago

audio-visualbmvclrsmulti-modalpytorchsparsesynchronizationtransformervggsound

satelllte/remotion-audio-visualizer

Programmatic minimalistic audio visualizations.

TypeScript471Updated 3 hours ago

audioaudio-visualaudio-visualizerdspremotionvideo

jinxiang-liu/anno-free-AVS

Official code for WACV 2024 paper, "Annotation-free Audio-Visual Segmentation"

Python383Updated 1 week ago

audio-visualaudio-visual-segmentationsegmentationsemantic-segmentation

MengyuanChen21/CVPR2023-CMPAE

[CVPR 2023] Collecting Cross-Modal Presence-Absence Evidence for Weakly-Supervised Audio-Visual Event Perception

Python364Updated 6 months ago

audio-visualaudio-visual-learningaudio-visual-video-parsingcvpr2023video-understanding

joannahong/AV-RelScore

Audio-Visual Corruption Modeling of our paper "Watch or Listen: Robust Audio-Visual Speech Recognition with Visual Corruption Modeling and Reliability Scoring" in CVPR23

Python352Updated 4 months ago

audio-visualavsrmultimodal

ruohaoguo/ovavss

Official Implementation of "Open-Vocabulary Audio-Visual Semantic Segmentation" [ACM MM 2024 Oral].

Python352Updated 4 months ago

audio-visualdeep-learningopen-vocabularysemantic-segmentationsound-localizationtransformervideo-processing

WikiChao/DAVIS

[🏆 IJCV 2025 & ACCV 2024 Best Paper Honorable Mention] Official pytorch implementation of the paper "High-Quality Visually-Guided Sound Separation from Diverse Categories"

Python284Updated 1 month ago

audio-visualcomputer-visionseparation

MCG-NJU/JoMoLD

[ECCV 2022] Joint-Modal Label Denoising for Weakly-Supervised Audio-Visual Video Parsing

Python272Updated 1 year ago

audio-visual

dialogtekgeek/AVSD-DSTC10_Official

Audio Visual Scene-Aware Dialog (AVSD) Challenge at the 10th Dialog System Technology Challenge (DSTC)

272Updated 2 years ago

audio-visualdialogqascene-awarevideo-description

dialogtekgeek/AudioVisualSceneAwareDialog

No description provided.