"topic:diarization" — Search

一站式全自动字幕生成软件，下载、转录、翻译、压制全流程覆盖，无需人工介入 / One-stop automated subtitle generator. Handles downloading, transcription, translation, and hardcoding—zero human intervention required.

TypeScript39629Updated 7 hours ago

alignmentass-subtitlescaptionsdiarizationffmpegforced-alignmentgemini-apigemini-subtitle-proi18nspeaker-diarizationspeech-to-textsrt-subtitlessubstation-alphasubtitle-generatorsubtitle-translationsubtitlessubtitles-generatortranscriptionwhisper

gong-io/gecko

Gecko - A Tool for Effective Annotation of Human Conversations

JavaScript30346Updated 2 weeks ago

annotating-filesdiarizationhuman-conversationstranscriptionvoice-detection

thewh1teagle/sherpa-rs

Rust bindings to https://github.com/k2-fsa/sherpa-onnx

Rust30263Updated 1 day ago

audiodiarizationembeddingsrustsherpaspeech-recognition

narcotic-sh/senko

Very fast, accurate speaker diarization

Python24020Updated 1 day ago

audio-aidiarizationfbankpyannoterapidssilero-vadspeaker-diarizationzanshin

homelab-00/TranscriptionSuite

A fully local and private Speech-To-Text app with cross-platform support, speaker diarization, Audio Notebook mode, LM Studio integration, and both longform and live transcription.

Python22620Updated 2 hours ago

diarizationdictationdockerfaster-whisperlinuxlocalmacosnemonotebookopen-sourceparakeetrealtimesecurespeech-to-texttailscaletranscriptionvibevoicewhisperwhisperxwindows

SuyashMore/MevonAI-Speech-Emotion-Recognition

Identify the emotion of multiple speakers in an Audio Segment

C17946Updated 4 weeks ago

artificial-intelligencecolab-notebookconvolutional-neural-networksdeep-learningdiarizationemotion-analysisemotion-recognitionkeras-tensorflowmachine-learningmfccmfcc-analysisspeech-processinguis-rnn

cvqluu/simple_diarizer

Simplified diarization pipeline using some pretrained models - audio file to diarized segments in a few lines of code

Python15532Updated 3 weeks ago

asrcolab-notebookdiarizationspeaker-diarizationspeech-to-texttranscription

taresh18/TTSizer

🎙️ Automatically transcribe audio/video into high-quality, speaker-specific Text-To-Speech datasets ✨

Python13519Updated 1 week ago

audioautomatic-speech-recognitiondiarizationspeech-recognitiontext-to-speech

thewh1teagle/pyannote-rs

pyannote audio diarization in rust

Rust10621Updated 3 days ago

asrdiarizationonnxruntimerustspeech-recognitionwhisper

desh2608/dover-lap

Python package for combining diarization system outputs.

Python9212Updated 2 months ago

diarizationdover-lapensemble-machine-learning

bunyaminergen/Callytics

Callytics is an advanced call analytics solution that leverages speech recognition and large language models (LLMs) technologies to analyze phone conversations from customer service and call centers.

Python7810Updated 2 days ago

denoisingdiarizationforced-alignmentllama3llmopenaiopensourcesentiment-analysisspeech-emotion-recognitionspeech-processingspeech-recognitionspeech-to-textsummarytopic-modelingtranscriptionvoice-activity-detectionvoice-recognition

empenoso/offline-audio-transcriber

Локальное и бесплатное распознавание речи с помощью OpenAI Whisper. Автоматизируйте расшифровку лекций и совещаний на вашем ПК без облачных сервисов и подписок

Python7422Updated 2 days ago

diarizationwhisperwhisperx

Picovoice/falcon

On-device speaker diarization powered by deep learning

Python697Updated 1 week ago

deep-learningdiarizationon-devicespeaker-diarizationspeaker-recognition

JSchmie/ScrAIbe

Tool for automatic transcription and speaker diarization based on whisper and pyannote.

Python6319Updated 3 weeks ago

diarizationspeech-to-texttranscription

wq2012/SimpleDER

A lightweight library to compute Diarization Error Rate (DER).

Python629Updated 1 month ago

diarizationmachine-learningmetricsspeaker-diarizationspeech-processingspeech-recognition

jeanjerome/EchoInStone

EchoInStone is an audio processing tool that transcribes, diarizes, and aligns speaker segments from audio files, prioritizing accuracy and reliability.

Python528Updated 1 day ago

alignmentdiarizationlocalhostpyannotepythontranscribewhisper

cvqluu/nn-similarity-diarization

Neural network based similarity scoring for diarization (pytorch implementation of "LSTM based Similarity Measurement with Spectral Clustering for Speaker Diarization")

Python4312Updated 1 week ago

diarizationkaldilstmneural-networkpytorchsimilaritysimilarity-scorespeaker-diarizationspeaker-recognitionspeech

namastexlabs/murmurai

🎙️ Drop-in replacement for paid transcription APIs. Self-hosted, GPU-powered, speaker diarization. Free forever: uvx murmurai

Python3916Updated 3 weeks ago

aiapiasrdiarizationstttext-to-speechtranscriptionttswhisper-aiwhisperx

FoxNoseTech/diarize

Speaker diarization for Python — "who spoke when?" CPU-only, no API keys, Apache 2.0. ~10.8% DER on VoxConverse, 8x faster than real-time.

Python361Updated 16 hours ago

apache-2audio-analysiscpu-inferencediarizationmeeting-transcriptiononnxpythonrttmspeaker-diarizationspeaker-embeddingspeaker-recognitionspectral-clusteringspeech-processingspeech-to-textvoice-activity-detectionwho-spoke-when

desh2608/spyder

Simple Python package for fast DER computation