"topic:rocm" — Search

Lemonade helps users discover and run local AI apps by serving optimized LLMs right from their own GPUs and NPUs. Join our discord: https://discord.gg/5xXzkMu8Zk

C++2.3k202Updated 7 hours ago

aiamdgenaigpullamallmllm-inferencelocal-servermcpmcp-servermistralnpuonnxruntimeopenai-apiqwenradeonrocmryzenvulkan

deepmodeling/deepmd-kit

A deep learning package for many-body potential energy representation and molecular dynamics

Python1.9k598Updated 1 day ago

aseccomputational-chemistrycppcudadeep-learningdeepmdipijaxlammpsmachine-learning-potentialmaterials-sciencemolecular-dynamicsnodejspaddlepotential-energypythonpytorchrocmtensorflow

aphrodite-engine/aphrodite-engine

Large-scale LLM inference engine

C++1.7k187Updated 7 hours ago

api-restcudainference-engineinferentiaintelloramachine-learningrocmspeculative-decodingtpu

dmlc/nnvmArchived

No description provided.

C++1.7k278Updated 6 months ago

computation-graphcudadeep-learningdeploymentmetalnnvmopencloptimizationrocmtvm

stotko/stdgpu

stdgpu: Efficient STL-like Data Structures on the GPU

C++1.3k98Updated 4 days ago

cppcpp17cpp20cudadata-structuresgpgpugpugpu-accelerationgpu-computinghipmodern-cppopenmprocmstlstl-containersstl-like

devnen/Chatterbox-TTS-Server

Self-host the powerful Chatterbox TTS model. This server offers a user-friendly Web UI, flexible API endpoints (incl. OpenAI compatible), predefined voices, voice cloning, and large audiobook-scale text processing. Runs accelerated on NVIDIA (CUDA), AMD (ROCm), and CPU.

Python1.1k260Updated 4 hours ago

aiapi-serveraudio-generationchatterboxchatterbox-ttscudafastapihuggingfaceopenai-apipythonpytorchrocmspeech-synthesisspeech-synthesis-apitext-to-speechttstts-apivoice-cloningweb-ui

SemiAnalysisAI/InferenceX

Open Source Continuous Inference Benchmarking Qwen3.5, DeepSeek, GPTOSS - GB200 NVL72 vs MI355X vs B200 vs GB300 NVL72 vs H100 & soon™ TPUv6e/v7/Trainium2/3

Python63998Updated 10 hours ago

aiamdbenchmarkcudagb200llmnvidiapytorchrocmsglangvllm

ROCm/ROCm-docker

Dockerfiles for the various software layers defined in the ROCm software platform

Shell51377Updated 1 day ago

dockerrocm

alpaka-group/alpaka

Abstraction Library for Parallel Kernel Acceleration :llama:

C++40785Updated 1 week ago

cppcpp17cudagpuheader-onlyheterogeneous-parallel-programminghiphpcopenaccopenmprocmtbb

ROCm/rocBLAS

[DEPRECATED] Moved to ROCm/rocm-libraries repo

C++390192Updated 1 month ago

blashiprocm

QMCPACK/qmcpack

Main repository for QMCPACK, an open-source production level many-body ab initio Quantum Monte Carlo code for computing the electronic structure of atoms, molecules, and solids with full performance portable GPU support

C++380150Updated 8 hours ago

c-plus-pluscudaelectronic-structuregpuhigh-performance-computinghpcmpioneapiquantum-chemistryquantum-monte-carlorocm

ROCm/k8s-device-plugin

Kubernetes (k8s) device plugin to enable registration of AMD GPU to a container cluster

Go37574Updated 4 days ago

k8skuberneteskubernetes-device-pluginsrocm

hybridgroup/yzma

Go with your own intelligence - Go applications that directly integrate llama.cpp for local inference using hardware acceleration.

Go34611Updated 2 hours ago

arduino-uno-qcudaggufgolangjetson-orin-nanollamallamacppllmmetalpuregoraspberry-pirocmvlmvulkan

agenium-scale/nsimd

Agenium Scale vectorization library for CPUs and GPUs

C33831Updated 2 weeks ago

aarch64avxavx2avx512cpp20cpp20-librarycudahpcneonneon128rocmsimdsimd-instructionssimd-librarysimd-programmingsse2sse42svevectorization-library

MFlowCode/MFC

Exascale multiphase flow solver — 2025 Gordon Bell Prize Finalist | 200T grid points on 43K+ GPUs

Fortran331132Updated 7 hours ago

amd-gpucfdcomputational-fluid-dynamicscudaexascalefluid-dynamicsfortrangpugpu-computinghpcmpimultiphasenvidia-gpuopenaccopenmpparallel-computingphysics-simulationrocmscientific-computingsimulation

JuliaGPU/AMDGPU.jl

AMD GPU (ROCm) programming in Julia

Julia32766Updated 4 days ago

amdgpugpugpu-programmingjuliarocm

ROCm/aomp

AOMP is an open source Clang/LLVM based compiler with added support for the OpenMP® API on Radeon™ GPUs. Use this repository for releases, issues, documentation, packaging, and examples.

Fortran24156Updated 20 hours ago

amdclangfortran-compilerllvmopenmprocm

llnl/hiop

HPC solver for nonlinear optimization problems

C++22545Updated 3 weeks ago

acopfbfgsconstrained-optimizationcudagpu-supporthpcinterior-point-methodinterior-point-optimizermath-physicsmpinonlinear-optimizationnonlinear-programmingnonlinear-programming-algorithmsnonsmooth-optimizationoptimizationparallel-programmingquasi-newtonradiussrocmsolver

eth-cscs/COSMA

Distributed Communication-Optimal Matrix-Matrix Multiplication Algorithm

C++21231Updated 6 days ago

communication-optimalcudagpu-accelerationlinear-algebramatmulmatrix-multiplicationmpipdgemmrocmscalapack

supranational/sppark

Zero-knowledge template library

Cuda21195Updated 5 days ago

bls12-377bls12-381cudanttpasta-curvesrocmzero-knowledgezero-knowledge-proofszk-snarkszk-starks

ROCm/MIVisionX

MIVisionX toolkit is a set of comprehensive computer vision and machine intelligence libraries, utilities, and applications bundled into a single toolkit. AMD MIVisionX also delivers a highly optimized open-source implementation of the Khronos OpenVX™ and OpenVX™ Extensions.

C++20887Updated 2 days ago

amd-openclamd-opencvamd-openvxcomputer-visioninferenceinference-enginekhronos-openvxmachine-learningneural-networknnefonnxopenclopenvxopenvx-extensionsopenvx-neural-networkrocmryzenvirtual-realitywindows-machine-learningwinml

ROCm/rocFFT

[DEPRECATED] Moved to ROCm/rocm-libraries repo

C++19995Updated 1 month ago

amdfastfftfouriergpuhiprocmtransform

JuliaGPU/AcceleratedKernels.jl

Cross-architecture parallel algorithms for Julia's CPU and GPU backends. Targets multithreaded CPUs, and GPUs via Intel oneAPI, AMD ROCm, Apple Metal, Nvidia CUDA.

Julia18611Updated 2 weeks ago

amdapplecudagpuinteljuliametalnvidiaoneapiparallelrocmstandard-library

Dr-Noob/gpufetch

Simple yet fancy GPU architecture fetching tool

C++18017Updated 1 day ago

amdamdgpucudagpuhsaigpuintelnvidiarocm

ROCm/iris

AMD RAD's multi-GPU Triton-based framework for seamless multi-GPU programming

Python17934Updated 1 day ago

async-programmingcommunicationdistributed-computingfused-kernelgemmgpgpuhipkernel-fusionmlmultigpurdmaremote-memory-accessrmarocmshmemsymmetric-memorytritonworkgroup-specialization

Page 1 of 9