"topic:model-parallelism" — Search | GitHunt

© 2026 GitHunt · tansuasici

39 results for “topic:model-parallelism”

deepspeedai/DeepSpeed

DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.

Python41.8k4.7kUpdated just now

billion-parameterscompressiondata-parallelismdeep-learninggpuinferencemachine-learningmixture-of-expertsmodel-parallelismpipeline-parallelismpytorchtrillion-parameterszero

hpcaitech/ColossalAI

Making large AI models cheaper, faster and more accessible

Python41.4k4.5kUpdated 2 hours ago

aibig-modeldata-parallelismdeep-learningdistributed-computingfoundation-modelsheterogeneous-traininghpcinferencelarge-scalemodel-parallelismpipeline-parallelism

kakaobrain/torchgpipe

A GPipe implementation in PyTorch

Python86298Updated 4 days ago

checkpointingdeep-learninggpipemodel-parallelismparallelismpipeline-parallelismpytorch

PaddlePaddle/PaddleFleetX

飞桨大模型开发套件，提供大语言模型、跨模态大模型、生物计算大模型等领域的全流程开发工具链。

Python477165Updated 1 week ago

benchmarkclouddata-parallelismdistributed-algorithmelasticfleet-apilarge-scalelightningmodel-parallelismpaddlecloudpaddlepaddlepipeline-parallelismpretrainingself-supervised-learningunsupervised-learning

Oneflow-Inc/libai

LiBai(李白): A Toolbox for Large-Scale Distributed Parallel Training

Python40658Updated 1 week ago

data-parallelismdeep-learningdistributed-traininglarge-scalemodel-parallelismnlponeflowpipeline-parallelismself-supervised-learningtransformervision-transformer

kaiyuyue/torchshard

Slicing a PyTorch Tensor Into Parallel Shards

Python30015Updated 1 week ago

model-parallelismpytorchtensor-parallelism

alibaba/EasyParallelLibrary

Easy Parallel Library (EPL) is a general and efficient deep learning framework for distributed model training.

Python27150Updated 3 months ago

data-parallelismdeep-learningdistributed-traininggpumemory-efficientmodel-parallelismpipeline-parallelism

Shenggan/awesome-distributed-ml

A curated list of awesome projects and papers for distributed training or inference

26630Updated 3 weeks ago

deep-learningdistributed-systemshigh-performance-computingmachine-learningmodel-parallelismpipeline-parallelism

hkproj/pytorch-transformer-distributed

Distributed training (multi-node) of a Transformer model

Python9440Updated 4 weeks ago

collective-communicationdata-parallelismdeep-learningdistributed-data-paralleldistributed-traininggradient-accumulationmachine-learningmodel-parallelismpytorchtutorial

xrsrke/pipegoose

Large scale 4D parallelism pre-training for 🤗 transformers in Mixture of Experts *(still work in progress)*

Python8719Updated 3 weeks ago

3d-parallelismdata-parallelismdistributed-optimizershuggingface-transformerslarge-scale-language-modelingmegatronmegatron-lmmixture-of-expertsmodel-parallelismmoepipeline-parallelismsequence-parallelismtensor-parallelismtransformerszero-1

tanyuqian/redco

NAACL '24 (Best Demo Paper RunnerUp) / MlSys @ NeurIPS '23 - RedCoast: A Lightweight Tool to Automate Distributed Training and Inference

Python697Updated 2 months ago

differential-privacydiffusion-modelsdistributed-trainingfedavgfederated-learningflan-t5-xxlgemmaimage-captioningjaxlarge-language-modelsllamamamlmeta-learningmixed-precisionmlsysmodel-parallelismpporeinforcement-learningseq2seqstable-diffusion

NERSC/sc23-dl-tutorial

SC23 Deep Learning at Scale Tutorial Material

Python4910Updated 2 months ago

ai-for-sciencedata-parallelismdeep-learningmodel-parallelismvision-transformers

vdutts7/dnn-distributed

Distributed training of DNNs • C++/MPI Proxies (GPT-2, GPT-3, CosmoFlow, DLRM)

C++4312Updated 6 months ago

deep-neural-networksdistributed-deep-learningdnnmessage-passing-interfacemodel-parallelismmpi

NERSC/dl-at-scale-training

Deep Learning at Scale Training Event at NERSC

Python2214Updated 1 month ago

data-parallelismdeep-learninghpcmodel-parallelismperformance-optimization

NERSC/dl4sci25-dl-at-scale

Deep learning for science school material 2025

Python195Updated 3 days ago

data-parallelismdeep-learningmodel-parallelismparallel-computingtransformerweather-forecast

WIP. Veloce is a low-code Ray-based parallelization library that makes machine learning computation novel, efficient, and heterogeneous.

Python170Updated 5 months ago

data-parallelismdeep-learningdistributeddistributed-computingheterogeneitymodel-parallelismparameter-serverpytorchraysparsity

NERSC/sc25-dl-tutorial

Deep Learning at Scale @ SC25

Python137Updated 3 days ago

ai-weatherdata-parallelismdeep-learningmodel-parallelismoptimization

AlibabaPAI/FlashModels

Fast and easy distributed model training examples.

Python124Updated 5 months ago

data-parallelismdeep-learningdistributed-trainingfsdpllmmodel-parallelismpytorchsequence-parallelismtensor-parallelismxlazero

ShashankSubramanian/transformer-perf-estimates

Performance Estimates for Transformer AI Models in Science

Jupyter Notebook101Updated 3 months ago

ai-for-sciencemodel-parallelismperformance-modeling-and-analysistransformer

Adaptive Tensor Parallelism for Foundation Models

Python90Updated 1 year ago

attentiondistributed-traininggptlarge-modelmodel-parallelismpytorchtransformer

atakehiro/3D-U-Net-pytorch-model-parallel

PyTorch implementation of 3D U-Net with model parallel in 2GPU for large model

Python90Updated 2 years ago

3d-unetmodel-parallelismpytorch

fanpu/DynPartition

Official implementation of DynPartition: Automatic Optimal Pipeline Parallelism of Dynamic Neural Networks over Heterogeneous GPU Systems for Inference Tasks

Python70Updated 8 months ago

dynamic-neural-networkdynpartitionmachine-learningmodel-parallelismneural-networkspipeline-parallelismpytorchreinforcement-learningschedulingtreelstm

garg-aayush/model-parallelism

Model parallelism for NN architectures with skip connections (eg. ResNets, UNets)

Python50Updated 1 year ago

gpipemodel-parallelismpipeline-parallelismpytorch

dlzou/computron

Serving distributed deep learning models with model parallel swapping.

Jupyter Notebook50Updated 1 year ago

deep-learninginference-servermodel-parallelism

dscpesu/NetTorrent

A decentralized and distributed framework for training DNNs

Python40Updated 4 months ago

data-parallelismdistributed-computingmodel-parallelismp2p-networks

explcre/pipeDejavu

pipeDejavu: Hardware-aware Latency Predictable, Differentiable Search for Faster Config and Convergence of Distributed ML Pipeline Parallelism

Jupyter Notebook30Updated 2 years ago

baysian-optimisationdata-parallelismdeep-learningdifferentiable-dynamic-programmingdifferentiable-programmingdistributed-trainingdynamic-programminghardware-awarelinear-regressionmodel-parallelismparallel-optmizationpipeline-parallelismpredictive-modelingpythonpytorchrandom-initializationsampling-methods

Development of Project HPGO | Hybrid Parallelism Global Orchestration

30Updated 4 years ago

data-parallelismdistributed-traininggpipemachine-learningmodel-parallelismpipedreampipeline-parallelismpytorchrusttensorflow

ngrabaskas/Torch-Automatic-Distributed-Neural-Network

Torch Automatic Distributed Neural Network (TorchAD-NN) training library. Built on top of TorchMPI, this module automatically parallelizes neural network training.

Lua22Updated 6 years ago

data-parallelismdistributed-machine-learningmachine-learningmodel-parallelismneural-networkopenmpitorch7

AnveshaM/Enhancing-performance-of-big-data-machine-learning-models-on-Google-Cloud-Platform

The project is focused on parallelising pre-processing, measuring and machine learning in the cloud, as well as the evaluation and analysis of the cloud performance.

Jupyter Notebook21Updated 1 year ago

cachedata-parallelismdataproc-clustersgoogle-cloud-ai-platformgoogle-cloud-platformgoogle-colaboratorykeras-tensorflowmlmodel-parallelismpysparkrdd

EunjuYang/distributed-tf

distributed tensorflow (model parallelism) example repository

Python20Updated 6 years ago

distributed-tensorflowmodel-parallelism

Page 1 of 2