"topic:cosine-similarity" — Search

1,655 results for “topic:cosine-similarity”

Implementation of various string similarity and distance algorithms: Levenshtein, Jaro-winkler, n-Gram, Q-Gram, Jaccard index, Longest Common Subsequence edit distance, cosine similarity ...

Java2.7k416Updated 3 days ago

algorithmcosine-similaritydamerau-levenshteindistancedistance-measurejaro-winklerjavalevenshtein-distanceshinglessimilarity-measuresstring-distance

FALCONN-LIB/FALCONN

FAst Lookups of Cosine and Other Nearest Neighbors (based on fast locality-sensitive hashing)

C1.2k194Updated 1 week ago

tensorflow/similarityArchived

TensorFlow Similarity is a python package focused on making similarity learning quick and easy.

Python1.0k105Updated 2 weeks ago

barlow-twinsclusteringcontrastive-learningcosine-similaritydeep-learningknnmachine-learningmetric-learningnearest-neighbor-searchnearest-neighborspythonsimclrsimclr2similarity-learningsimilarity-searchsimsiamtensorflowunsupervised-learning

philippgille/chromem-go

Embeddable vector database for Go with Chroma-like interface and zero third-party dependencies. In-memory with optional persistence.

Go89062Updated just now

chromachromadbcosine-similarityembeddedembeddingsgogolangin-memoryllmllmsnearest-neighborragretrieval-augmented-generationvector-databasevector-search

qdrant/quaterion

Blazing fast framework for fine-tuning similarity learning models

Python66148Updated 2 hours ago

contrastive-learningcosine-similaritydeep-learningknnmachine-learningmetric-learningnearest-neighbor-searchpythonpytorchpytorch-lightningsimilarity-learningsimilarity-search

mattmurray/music_recommender

Music recommender using deep learning with Keras and TensorFlow

Jupyter Notebook546124Updated 1 month ago

cnnconvolutional-neural-networkscosine-similaritydeep-learningkeras-tensorflowmusicrecommender-systemspectrogram

feature23/StringSimilarity.NET

A .NET port of java-string-similarity

C#51173Updated 1 week ago

algorithmscosine-similaritydamerau-levenshteindistancedotnetjaro-winklerlcs-distancelevenshtein-distanceshinglessimilarity-measuresstringstring-distancestring-metricsstringswinkler

KristiyanVachev/Question-Generation

Generating multiple choice questions from text using Machine Learning.

Jupyter Notebook494114Updated 5 days ago

ing-bank/sparse_dot_topn

Python package to accelerate the sparse matrix multiplication and top-n similarity selection

C++42186Updated 23 hours ago

lior-k/fast-elasticsearch-vector-scoring

Score documents using embedding-vectors dot-product or cosine-similarity with ES Lucene engine

Java406112Updated 1 month ago

purvasingh96/AI-for-Trading

📈This repo contains detailed notes and multiple projects implemented in Python related to AI and Finance. Follow the blog here: https://purvasingh.medium.com

Jupyter Notebook402102Updated 1 week ago

ai-for-tradingalpha-factorsbacktestingcosine-similarityfactor-modelsmomentum-trading-strategynanodegreenlp-taskspairs-tradingportfolio-optimizationrisk-factor-modelstradingudacityvolatility

derrickburns/generalized-kmeans-clustering

Production-ready K-Means clustering for Apache Spark with pluggable Bregman divergences (KL, Itakura-Saito, L1, etc). 6 algorithms, 740 tests, cross-version persistence. Drop-in replacement for MLlib with mathematically correct distance functions for probability distributions, spectral data, and count data.

Scala34253Updated 1 week ago

bregman-divergenceclusteringcosine-similarityembeddingsentropyeuclidean-distanceitakura-saito-divergencek-meanskullback-leibler-divergencesimilarity-searchsparkspark-mllib

Kalebu/Plagiarism-checker-Python

A python project for checking plagiarism of documents based on cosine similarity

Python326174Updated 5 days ago

nitaiaharoni1/vector-storage

Vector Storage is a vector database that enables semantic similarity searches on text documents in the browser's local storage. It uses OpenAI embeddings to convert documents into vectors and allows searching for similar documents based on cosine similarity.

TypeScript24439Updated 1 month ago

Mihaiii/semantic-autocomplete

A blazing-fast semantic search React component. Match by meaning, not just by letters. Search as you type without waiting (no debounce needed). Rank by cosine similarity.

JavaScript2285Updated 1 day ago

vectornguyen76/face-recognition

Real-Time Face Recognition use SCRFD, ArcFace, ByteTrack and Similarity Measure

Python19253Updated 2 hours ago

arcfacebytetrackcosine-similarityface-alignmentface-detectionface-recognitioninsightfacemultithreadingreal-timescrfdyolov5-face

sjy-dv/coltt

Coltt is a vector database that supports Multi-Vector Search, high-performance HNSW, FLAT and quantization, and enables fast searches through sophisticated internal data shard design.

Go1842Updated 1 week ago

kiwirafe/xiangsi

中文文本相似度计算器

Python17024Updated 18 hours ago

patricktrainer/duckdb-embedding-search

Fast similarity search using DuckDB

Python1467Updated 3 weeks ago

andreekeberg/ml-classify-text-js

Machine learning based text classification in JavaScript using n-grams and cosine similarity

JavaScript13511Updated 1 week ago

artificial-intelligenceclassificationclassifiercosine-similaritylabelslibrarymachine-learningn-gramn-gramsnatural-language-processingpredictionssentiment-analysissimilaritytext-classificationtext-classifiertraining

williamscott701/Information-Retrieval

Information Retrieval algorithms developed in python. To follow the blog posts, click on the link:

Jupyter Notebook133150Updated 1 month ago

ritchie46/lsh-rs

Locality Sensitive Hashing in Rust with Python bindings

Rust12223Updated 2 weeks ago

chrismattmann/tika-similarity

Tika-Similarity uses the Tika-Python package (Python port of Apache Tika) to compute file similarity based on Metadata features.

Python10860Updated 3 weeks ago

clusteringcosine-distancecosine-similarityinformation-retrievaljaccard-similaritymachine-learningmetadata-featurespythonsimilarity-scoretikatika-pythontika-similarity

abhilampard/Simple-Plagiarism-Checker

Web Application for checking the similarity between query and document using the concept of Cosine Similarity.

Python10666Updated 3 days ago

kamwoh/orthohash

[NeurIPS 2021] Official implementation of the paper "One Loss for All: Deep Hashing with a Single Cosine Similarity based Learning Objective"

Python988Updated 6 days ago

jMotif/sax-vsm_classic

SAX-VSM public release, visit our website for detail

Java9431Updated 6 months ago

Azure-Samples/azure-sql-db-openai

Samples on how to use Azure SQL database with Azure OpenAI

TSQL9340Updated 1 week ago

azure-sqlazure-sql-databasecosine-distancecosine-similarityopen-ai

guillaume-chevalier/GloVe-as-a-TensorFlow-Embedding-Layer

Taking a pretrained GloVe model, and using it as a TensorFlow embedding weight layer **inside the GPU**. Therefore, you only need to send the index of the words through the GPU data transfer bus, reducing data transfer overhead.

Jupyter Notebook9019Updated 6 months ago

rragundez/chunkdot

Multi-threaded matrix multiplication and cosine similarity calculations for dense and sparse matrices. Appropriate for calculating the K most similar items for a large number of items by chunking the item matrix representation (embeddings) and using Numba to accelerate the calculations.

Python865Updated 2 months ago

vickumar1981/stringdistance

A fuzzy matching string distance library for Scala and Java that includes Levenshtein distance, Jaro distance, Jaro-Winkler distance, Dice coefficient, N-Gram similarity, Cosine similarity, Jaccard similarity, Longest common subsequence, Hamming distance, and more..

Scala8214Updated 4 weeks ago

Page 1 of 34