"topic:pyannote" — Search

EchoInStone is an audio processing tool that transcribes, diarizes, and aligns speaker segments from audio files, prioritizing accuracy and reliability.

Python528Updated 1 week ago

alignmentdiarizationlocalhostpyannotepythontranscribewhisper

nttcslab-sp/mamba-diarization

Official repository for Mamba-based Segmentation Model for Speaker Diarization

Python476Updated 2 weeks ago

mamba-state-space-modelspyannotespeaker-diarizationstate-space-models

pulijon/Sttcast

Transcription from mp3 files to html with or without embedded player

Jupyter Notebook255Updated 5 days ago

ansibleartificial-intelligenceautomationaws-ec2aws-s3diarizationg4dngpuiacopenai-apipuppetpyannotepythonragterraformtranscriptionvagrantvosk-enginewhisperwhisperx

rafaelgalle/whisper-diarization-advanced

Ultra-fast, customizable speech-to-text and speaker diarization for noisy, multi-speaker audio. Includes advanced noise reduction, stereo channel support, and flexible audio preprocessing—ideal for call centers, meetings, and podcasts.

Python223Updated 2 days ago

pyannotetranscriptionwhisper

maximus-choi/Utterr

Real-time speaker diarization using straightforward, intuitive logic - High accuracy thanks to SpeechBrain/Pyannote-WeSpeaker models

Python211Updated 1 day ago

pyannotereal-timerealtimespeaker-diarizationspeaker-recognitionspeaker-verificationspeechspeechbrain

FrenchKrab/datasets-pyannote

Automatically setup the AISHELL-4 and MSDWild dataset for usage with pyannote-database (and pyannote-audio)

Shell154Updated 2 months ago

aishell-4datasetmsdwildpyannote

ringger/transcribe-critic

Multi-source transcript merging inspired by textual criticism — LLM adjudicates multiple Whisper, YouTube captions & external transcripts for higher quality. Includes speaker diarization and summarization.

Python141Updated 3 days ago

apple-siliconasrclaudellmmulti-sourcenlpollamapodcast-transcriptionpyannotespeaker-diarizationspeech-recognitionsummarizationtextual-criticismtranscript-mergingtranscriptionwdiffwhisperyoutube-transcription

CrispStrobe/Susurrus

speech to text gui for different (mostly Whisper, also Voxtral) models and backends, including whisper.cpp, mlx-whisper, faster-whisper, ctranslate2; applies pyannote for diarization

Python111Updated 2 months ago

ctranslate2diarizationpyannotepyannote-audiospeech-to-textsttvoxtralwhisperwhisper-aiwhisper-cppwhispercpp

jumtra/agenda_maker

A package that can be locally executed to generate minutes in Japanese

Python100Updated 10 months ago

agendaagenda-appjapanese-languagellmminutesminutes-of-meetingpyannotetranscriptionwhisper

austinwmille/orca

you feed in a video; it outputs context contained clips resized to 9:16, keeping speaker in center

Python91Updated 4 months ago

clipsaidiarizationhuggingfacellmnltkpyannotewhisperx

gorkemkaramolla/whisper-run

Faster Whisper with Speaker Diarization

Python91Updated 1 month ago

distil-whisperfaster-whisperopenaipyannotespeaker-diarizationspeech-recognitiontranscriptionwhisperwhisper-large

Mekopa/whisperx-blackwell

GPU-accelerated WhisperX on NVIDIA Blackwell (SM_121) - DGX Spark compatible

Python70Updated 1 week ago

asraudioblackwellcudadeep-learningdgxdgx-sparkdockergpumachine-learningnvidiapyannotepytorchsm-121speaker-diarizationspeech-recognitiontranscriptionwhisperx

jarvisx17/ASR

ASR (Automatic Speech Recognition) Notebooks

Jupyter Notebook62Updated 2 months ago

asrdiartnemopyannotespeakerswhisperwhisperx

TheSeraphim/scribe-forge-ai

🎵 Complete offline audio transcription system with speaker diarization using OpenAI Whisper and PyAnnote. Features automatic audio cleaning, precise timestamps, multiple output formats (JSON/TXT/Markdown), and support for 20+ audio formats. No external APIs required - works entirely offline.

Python60Updated 4 months ago

audio-analysisaudio-cleaningaudio-processingaudio-transcriptiondiarizationffmpeghuggingfacemachine-learningmulti-speakernlpoffline-transcriptionopenai-whisperpyannotepythonspeaker-diarizationspeech-recognitionspeech-to-texttimestampstranscription-toolwhisper

ekleziast/kiwi-voice

Voice interface for OpenClaw with speaker recognition, voice-gated security, real-time barge-in, and multi-provider streaming TTS

Python60Updated 1 day ago

ai-assistanthome-assistantopenclawprivacypyannotepythonself-hostedspeaker-identificationspeech-to-textstttext-to-speechttsvoice-assistantvoice-interfacewake-wordwhisper

papatistos/swhisper

Verbatim Swedish Whisper transcription and speaker diarization with word-level time stamps

Python50Updated 2 weeks ago

diarizationpyannoteswedish-languagetranscriptionwhisper

palak-463/VoiceSyncPro

A versatile video localization tool that provides dubbing and audio synchronization with real-time pitch, accent, and emotional tone adjustments across multiple languages. 🗣️

Python51Updated 1 month ago

deeplapiffmpeggoogletranslateapigradiopyannotepythonpytorchwagner

deepanshu-yadav/big_audio_file_transcription

Transcript a big audio file with speaker diarization using NVidia parakeet v2

Python51Updated 3 days ago

audioaudio-processingaudio-transcriptiondiarizationgradionvidiaparakeetpyannoteresemblyzertranscription

gillan-krishna/meeting_notes

Hobby project to transcribe audio files from meetings to transcripts with a summary

Python42Updated 1 year ago

audiodeep-learninghobby-projectnlppyannotespeech-recognitionwhisper

dptools/WhisperNote

Subtitle generation w/ Speaker Diarization using Whisper and pyannote.audio